自動アノテーションの開始

📘

自動アノテーションの準備

事前に自動アノテーションの対象となるタスクを作成しておく必要があります。

プロジェクトの左サイドメニューで[自動アノテーション]をクリックすると、自動アノテーションページに遷移します。

クラスの紐付けを行う

まず初めに、登録しているアノテーションクラスと、モデルが予測するクラスの紐付けを行います。[設定]タブの、[クラスの紐付け]テーブル右上にある[編集]をクリックします。

ダイアログのステップに沿ってクラスの紐付けを行います。

  • ステップ1:自動アノテーションに利用したいモデルを選択
  • ステップ2:アノテーションクラスに登録されているクラスを選択
  • ステップ3:モデルが予測するクラスを選択

例えば、歩行者 クラスを、FastLabel Object Detection High Accuracy - 汎用 モデルにおける person クラスに紐付けるには画像のようにしてください。

最後に[ 保存 ]ボタンをクリックします。設定した内容が一覧で表示されます。

FastLabel AI OCR

帳票画像などに存在する文字列とその座標を検出することができます。
紐付けをおこなうアノテーションクラスにはタイプ : テキストの属性を設定しておく必要があります。

検出できる単位一覧

単位名内容
paragraph文字列(意味段落単位で検出)
block文字列(段落単位で検出)
word文字列(単語単位で検出)
symbol文字列(1文字単位で検出)

Easy OCR

帳票画像などに存在する文字列とその座標を検出することができます。
紐付けをおこなうアノテーションクラスにはタイプ : テキストの属性を設定しておく必要があります。

検出できる単位一覧

単位内容
paragraph文字列(意味段落単位で検出)
word文字列(単語単位で検出)

FastLabel License Plate & AI OCR

車の画像から、ナンバープレートと記載されている法規定された情報の座標と文字列を検出します。
アノテーションクラスにタイプ : テキストキー : textの属性を設定しておくと、検出した文字列をマッピングすることができます。

各要素はブロック単位で検出するか、1文字単位で検出するかを選択することができます。
検出できるクラスについてはこちらをご確認ください。

VGG16 画像 - 分類プロジェクト

紐付けをおこなうアノテーションクラスにはタイプ : ラジオボックス or セレクトボックスが利用できます。

VGG16 画像 - 矩形プロジェクト

紐付けをおこなうアノテーションクラスにはタイプ : ラジオボックス or セレクトボックスの属性が設定されている必要があります。自動アノテーションはすでにタスク存在するアノテーションに対して実行されます。

3582 3582 3582

FastLabel AI SR

録音された会話内の発言の文字列とその開始・終了時間を検出することができます。
紐付けをおこなうアノテーションクラスにはタイプ : テキストエリアキー : textの属性を設定しておく必要があります。

KEYPOINT RCNN

人物などの骨格推定を行うことができます。

「KEYPOINT RCNN R50 FPN - 汎用」の場合、COCO Datasetで定義されている17クラスと一致するキーを持つキーポイント(アノテーションクラスに定義)を少なくとも1件以上設定しておく必要があります。

ご自身で学習したモデルの場合は、モデルの推論クラスと一致するキーを持つキーポイント(アノテーションクラスに定義)を少なくとも1つ以上設定しておく必要があります。

COCO KEYPOINT CLASSES

クラス名部位
nose
left_eye左目
right_eye右目
left_ear左耳
right_ear右耳
left_shoulder左肩
right_shoulder右肩
left_elbow左肘
right_elbow右肘
left_wrist左手首
right_wrist右手首
left_hip左腰
right_hip右腰
left_knee左膝
right_knee右膝
left_ankle左足首
right_ankle右足首

MMPOSE ANIMAL POSE

動物の骨格推定を行うことができます。
ANIMAL POSEで定義されている20クラスと一致するキーを持つキーポイント(アノテーションクラスに定義)を少なくとも1件以上設定しておく必要があります。

ANIMAL POSE KEYPOINT CLASSES

クラス名部位
left_eye左目
right_eye右目
left_ear_base左耳
right_ear_base右耳
nose
throat
tail_base
withersき甲(肩甲骨の間の高くなっている部分)
lf_base_elbow左前関節
rf_base_elbow右前関節
lb_base_elbow左後関節
rb_base_elbow右後関節
lf_knee左前膝
rf_knee右前膝
lb_knee左後膝
rb_knee右後膝
lf_paw左前脚
rf_paw右前脚
lb_paw左後脚
rb_paw右後脚

BERT Base Uncased

紐付けをおこなうアノテーションクラスにはタイプ : ラジオボックス or セレクトボックスが利用できます。

GPT3.5(テキスト分類)

🚧

実行の失敗

実行が失敗した場合には時間をおいてリトライしてください。

紐付けをおこなうアノテーションクラスにはタイプ : ラジオボックス or セレクトボックスが利用できます。

1915

マッピング画面で指定された属性の値と選択肢を利用して、テキストの分類を行います。
下記の例では感情をテーマにした時にテキストの内容がポジティブ、ネガティブ、ニュートラルのどれに一番当てはまるかを自動で判断し分類します。

1915

自動アノテーションを実行する

🚧

アノテーションのスキップ

1タスクにつき最大1,000アノテーション、1回の実行につき最大10,000アノテーションまでサポートしています。上限を超えたアノテーションはスキップされます。

クラスの紐付けを設定し終えたら、[自動アノテーションを実行]をクリックします。表示されたダイアログの内容を確認・変更して再度[自動アノテーションを実行]をクリックします。

🚧

自動アノテーション実行時にリードタイムが発生します

自動アノテーション実行時に新しくサーバーを立ち上げるため、数分程度のリードタイムが発生します。

実行すると、[実行履歴]タブに遷移し、自動アノテーションの状態を確認できます。ステータスが完了になると、対象のタスクに自動でアノテーションされています。

実行時オプション

信頼度スコア

自動アノテーション実行時に、アノテーションを行う際の確度を計算しており、「信頼度」としてアノテーションごとに付与されます。

ここで設定された信頼度スコアを超えた結果のみアノテーションデータとしてタスクに登録されます。例えば、できるだけアノテーションを付与したい場合は信頼度スコアを低く設定するとアノテーションされる数が多くなる可能性は上がりますが、その分誤ったアノテーションが行われる可能性も高くなります。

一方で、信頼度スコアを高く設定すると、信頼度スコアを超えなかったアノテーションは登録されないため、自動でのアノテーション漏れが発生する可能性はありますが、確実性が高いアノテーションになります。

テストタイムオーギュメンテーション

📘

対応アルゴリズム

FastLabel Object Detection アルゴリズムのみに対応しています。

🚧

注意事項

テストタイムオーギュメンテーション機能はα版です。アップデートに伴い機能変更される可能性があります。

オーギュメンテーション とは、左右反転、回転、切り抜き、ぼかしなどによってデータを加工することで、学習用のデータ量を増幅させる手法のことです。こちらを推論時にも用いて精度向上を図ることをテストタイムオーギュメンテーション(TTA)と呼びます。

FastLabelでは、自動アノテーション時にテストタイムオーギュメンテーションを利用するかを選択することができます。利用することにより精度の向上が期待できますが、その分2〜3倍の時間を要します。

アノテーションクラスの作成とマッピングを自動で行う/行わない

📘

対応アルゴリズム

Computer Vision - 汎用 アルゴリズムのみに対応しています。

🚧

注意事項

1つのプロジェクトに設定できるアノテーションクラスの上限は1000件です。
アノテーションクラスを自動で追加していった結果、1000件を超えた分は自動アノテーション結果として反映されません。

クラスの紐付けが存在しない場合に、同じ値のアノテーションクラスを自動で追加することができます。
同じ値を持つアノテーションクラスがすでに設定されている場合はそのアノテーションクラスに検出結果をマッピングします。

「Computer VIsion - 汎用」では検出できるアノテーションクラスが公開されておらず、事前に設定を行うことができないケースがあります。
どのような種類のクラスが検出できるかを試してみたい場合や検出したいクラスが多すぎてマッピングが難しい場合にも便利な機能です。

既存アノテーションを上書きする/しない

自動アノテーション実行時に、すでにタスクに存在するアノテーションを上書きするかを選択することができます。「上書きする」を選択すると、既存のアノテーションは削除され、自動アノテーションされた結果のみが反映されます。

複数のモデルで自動アノテーションを実行しつつ、それぞれの結果を両方残したい場合などに「上書きしない」を選択すると、どちらのアノテーションもタスクに登録されます。

処理速度を変更する

📘

対応アルゴリズム

MaskRCNN アルゴリズムのみに対応しています。

MaskRCNNアルゴリズムを用いた自動アノテーションでは、実行完了までに他のアルゴリズムよりも多くの時間がかかることがあります。

素早く自動アノテーションの結果を確認するために、「処理速度」オプションを選択することができます。特に、長辺が2000pxを超えるような大きな画像に対して有効です。処理速度を早めることに比例し、アノテーションされる領域は本来の推論結果よりも荒くなることがあります。

自動アノテーションを実行する際に、ダイアログから[処理速度]を選択し、[自動アノテーションを実行]をクリックします。

実行結果サンプル

高速(低品質)

中速(中品質)

低速(高品質)

アノテーションと信頼度を確認する

自動でアノテーションされたタスクを開くと、自動でアノテーションされたデータを確認することができます。また、[ラベルを表示]アイコンをクリックすると、各アノテーションの信頼度を参照できます。信頼度によって表示を切り替えたい場合は、信頼度による調整を参照してください。

自動アノテーションの失敗について

🚧

オンデマンドインスタンスのリソースが不足し、自動アノテーションに失敗することがあります。これは、FastLabelが推論基盤にAWS SageMakerを用いており、AWS側のキャパシティが不足している状態であるためです。FastLabel側でキャパシティの制御ができないため、しばらく時間をおいて再度実行してください。