音声アノテーション

音声プロジェクトのアノテーション方法について説明します。

音声プロジェクトとは

音声データに対してアノテーションできます。

データの種類

  • MP3
  • WAV
  • M4A

データの容量

音声あたり最大120MB

セグメンテーション(Segmentation)

音声領域を分割して、その単位でテキストの書き起こしなどのアノテーションができます。(例:感情分類、話者分類)

アノテーションクラスを選択して、対象の音声領域をドラッグで選択します。アノテーションしたあとに、領域の修正なども可能です。

🚧

注意

音声のセグメンテーションを行う際には、ブラウザの拡大率を100%に設定してください。
拡大率が100%でない場合、アノテーションがずれてしまうことがあります。

2790

Audio Segmentation Annotation

分類(Classification)

音声全体に対して分類のアノテーションができます。

2792

Audio Classification Annotation