テキストから特定の文字を抽出する
この記事では、テキストから特定の文字を抽出する色々な方法を紹介します。
この記事では、一部で「正規表現」を利用します。
正規表現とは、文字の並び方のルールを使って、テキストの中から特定のパターンを探したり、置き換えたりするための方法です。
正規表現の記述は少し難しく覚えるまで大変ですが、一度使えるようになると文字検索や置換が一気に効率化でき、とても便利な仕組みです。
なお、対象とするテキストによっては、今回紹介する正規表現の表記に調整が必要な場合があります。
※正規表現の詳細については、こちらを参照ください。
各アクションの紹介
この記事では、以下のアクションを使用してテキストから文字を抽出する方法を紹介します。
- SplitTextアクション(テキストを分割)
- ReplaceTextアクション(検索して置換)
- MatchTextアクション(正規表現で検索)
まずは、各アクションを簡単に説明します。
キャプチャグループとは、正規表現の中で丸括弧 ( ) で囲んだ部分のことです。
正規表現にマッチした文字の一部を取り出したり、置換時に再利用したりできます。
( ) で囲まれた部分が 1つのキャプチャグループになり、前から順に $1、$2 で指定できます。
例:
・テキスト: 2012-12-12
・正規表現: (\d{4})-(\d{2})-(\d{2})
・グループ1($1): 2012 (年、4桁数字)
・グループ2($2): 12 (月、2桁数字)
・グループ3($3): 12 (日、2桁数字)
AUTOROでは、キャプチャグループを、ReplaceTextアクションやMatchTextアクションで利用できます。
設定例1:メールアドレスからドメインを抽出する
メールアドレス「account@testmail.co.jp」から、ドメイン部分「testmail.co.jp」のみを抽出する方法を紹介します。
- SplitTextアクションを使用する場合は、区切文字欄に「@」を設定して、メールアドレスを前後に分解します。
- SplitTextアクションの出力はリスト形式なので、GetItemFromListアクション(リストから要素を取得)で、リストの後半部分(インデックス1)を取得します。
参考:リスト/配列
- MatchTextアクションを使用する場合は、正規表現欄にドメイン部分を抽出できる正規表現を設定します。
ReplaceTextアクションと異なり、正規表現は目的の箇所を含む一部分を抜粋する表現で問題ありません。
今回は、「@以降の1文字以上の文字」として以下を設定します。@(.+)
また、キャプチャグループを利用するため、詳細オプション「マッチした文字列すべてを取得」を無効にします。
- MatchTextアクションの出力はリスト形式で、詳細オプション「マッチした文字列すべてを取得」を無効にした場合は以下のような出力になります。
[ 正規表現にマッチした全文, キャプチャグループ1, キャプチャグループ2, キャプチャグループ・・・ ]
今回は、GetItemFromListアクションで、キャプチャグループ1(インデックス1)を取得します。
設定例2:住所から都道府県名を抽出する
住所「東京都新宿区」から、都道府県部分のみを抽出する方法を紹介します。
設定例3:日付から月を抽出する
日付「2026/12/25」から、月部分「12」のみを抽出する方法を紹介します。



























