November 1 2021
TransPerfect DataForceでAIをよりスマートに
DataForceは、世界最高水準のデータ拡張・アノテーションサービスです。セキュリティ、柔軟性、拡張性に優れたデータ提供モデルと、世界屈指の強力なアノテーションおよびリソース管理プラットフォームを活用します。
- 音声の収集&アノテーション
- テキストの収集&アノテーション
- 画像の収集&アノテーション
- 動画の収集&アノテーション
- チャットボットのローカリゼーション
音声AI、自然言語処理(NLP)、コンピュータービジョン、対話型AIなど、お客様がどのようなAIを開発している場合でも、DataForceは徹底的に効率化されたプロセスやツールを活用して、お客様が利用するデータの収集とアノテーションを実施し、データセットの補完、バイアスの軽減、ラベリングを行います。
- 品質保証
- プログラム/プロジェクト管理
- お客様視点を持った取り組み
- 多彩なプラットフォームとの統合
データの収集、エンリッチメントには、安全性が高い弊社独自のモバイルツールやウェブベースのツールを用いる場合もありますが、お客様提供のプラットフォームを用いることも少なくありません。
- 100万人のアノテーションスタッフ
- 250言語に対応
- 業界別の専門アノテーションスタッフによる作業
- データ収集およびアノテーション
- ユーザー調査、ユーザーエクスペリエンスの検証
トランスパーフェクトでは、セキュリティを最優先しています。各種セキュリティ認証を取得済みの自社開発インフラで、お客様の機密データを安全に保護します。
- GDPR 準拠
- ISO 27001認証済み
- SOC 2認証済み
- HIPAA準拠
- お客様ごとの関連ポリシーを追加適用可能
よりスマートなAIをすべての言語に
DataForceは、200種類以上の言語でカスタム音声データを収集できます。多様な属性を備え、厳密な審査を通過した人材で構成されたスタッフグループが、40種類を超えるブランドのスマートフォンを含む、お客様が指定したプラットフォームで、録音した音声データを提供できます。カスタムデバイスや独自のデバイスにも対応可能です。
収集したデータは、DataForceチームによる品質レビューを経てカテゴリーごとに分類され、文字起こしされた後、お客様のもとに届けられます。データは管理されたデータワークフローで処理されます。
機械学習を活用するワークフローは、音声データをあらかじめ匿名化してから文字起こしの担当者に送り、さらなるセキュリティメカニズムを追加できます。
詳細は 音声レコーディングとテープ起こしのプロジェクトについてお伝えする事例紹介でご覧いただけます。
未来を見据えたサービス、製品、そして体験を開発・提供するために、組織は自社のテキストデータを活用する必要があります。これには、文書、レポート、Eメールのほか、その他の構造化データや半構造化データの情報が含まれます。プレシジョンメディシン(精密医療)やリスクマネジメント、対話型AIのAIソリューションを開発している場合、正確にラベリングされたデータでAIモデルをトレーニングできることは、導入を成功させる最も確実なプロセスとなります。
弊社のエキスパートであり、訓練を受けたアノテーターは、最先端のアノテーションツールを利用できます。微調整されたKPIや品質保証プロセスと組み合わせ、あらゆる分野や業界で最良のアノテーションを実現します。
コンピュータービジョンは、最もよく知られ、急速に普及が進んでいるAIテクノロジーの一つです。DataForceは、以下のような、専門領域に特化したサービスやテクノロジーを幅広く開発し、お客様の革新的な用途に対応しています。
- さまざまなデモグラフィー属性や、撮影場所(屋内/屋外など)、多様なハードウェアのオプション、センサーの種別に応じた、代表的なカスタムイメージや動画の収集。消費者向け製品、モバイルアプリ、医療機器、自動運転車、消費者行動のモニタリングなど、数多くの用途に活用されます
- バウンディングボックス、セマンティックセグメンテーション、3Dオブジェクト、LIDARなどを用いる画像と動画のアノテーション
- ユースケースや言語全体で、正確な文法と一貫性のあるスタイルを常に使用する画像と動画キャプション
コンピュータービジョンの分野で弊社が提供するあらゆるサービスに共通する特長として、以下が挙げられます。
- 卓越したカスタマーサービス
- 強固なセキュリティを備えたワークフロー
- プライバシー保護と品質管理手順に関する完全な透明性
- 厳しい選別を通過し、トレーニングを受けたアノテーター
- 対価格比で最適な品質
DataForceは、対話型システムのニーズに適用可能な、独自のエンドツーエンドのローカリゼーションプロセスを開発しています。高品質なトレーニングデータや文法を確立するだけにとどまらず、システムの応答メッセージがクリエイティブに翻訳されるなど、お客様のチャットボットやバーチャルアシスタントは以下を実現できるようになります。
- 流暢さ
- ブランドの独自性
- 文化的背景への配慮
- ターゲット市場における必須の規制要件の遵守
データや言語を扱うだけでなく、ユーザー体験やテスティングにまで広がる弊社のサービスによって、貴社の対話型AIソリューションは、自動車や家電、ウェブサイト、モバイルアプリなど、どのような市場や環境にも自信を持って送り出せるものになるはずです。
ヒューマンインザループ(人間参加型:HITL)モデルは、多くの組織で採用されており、商品や機能の改善のほか、検索アルゴリズムの改良にも活用されています。HITLプロセスでは、人間によるインプットと評価結果を収集し、検索結果とエンドユーザーの検索意図との関連性や品質を測定、訓練、最適化して、さらに優れたユーザー体験を得られるようにすることが重要です。
検索アルゴリズムの改善とトレーニングには、関連性を示す多数の信号と、膨大な量の教師データが必要です。とりわけ、製品が海外向けで多数の言語や市場に対応する場合、これは大きな課題となります。膨大な量の検索クエリを、検索結果と照らし合わせながらラベリングし、アノテーションや評価作業を実施して、検索アルゴリズムの適合度や品質の向上につながる有意義な考察を引き出すのは、すべて人間の評価者の仕事です。
DataForceは、この種の作業をすべて、選別された人間の評価者からなるコミュニティの力を借りて、単一の安全なプラットフォームで管理しながら進めることができます。
弊社サービスは、検索の適合性を高めるだけでなく、広告の適合性やレコメンデーションの適合性など、さまざまな種類のコンテンツモデレーションにも対応しています。