課題

Parking Datasets

自動駐車システム(APS)のためのロバストな認識モデルを開発する。
Learn more

Traffic Sign Datasets

交通標識の認識と分類のために、多様かつ物理的に正確なラベル付けされた訓練データを使用します。
Learn more

課題

先進運転支援システム(ADAS)や自動運転(AD)の開発では、訓練データセットの量と質がMLモデルの性能に直接影響します。しかし、現実世界での訓練データの収集は、時間とコストがかかり、現実世界のロジスティクスに制約されます。データアノテーションに関しては、人手によるラベリングでコストと時間がかかり、エラーも発生しやすいため、さらなる課題となります。

Synthetic Datasetsを選ぶ理由

Applied IntuitionのSynthetic Datasetsは、認識システム開発チームと検証チームが、MLモデル用の合成訓練データを定義、生成、活用できるようにすることで、データ駆動型のADASおよびAD開発を促進します。
自然言語、分布ベースの構造化言語、またはビジュアルエディタを使用してデータセットを定義し、モデルが必要とするデータをスケーラブルに取得
データセット管理ツールによる統計情報の表示、フィルタリング、データのエクスポート
公開済みのケーススタディでモデル性能の向上が証明されている生成されたデータセット

メリット

MLトレーニングのスピードアップ

新しいラベル付きデータセットを取得しモデルの反復学習を最大32倍高速化。

データコストの削減

データ収集とラベリングにかかる費用を最大95%削減。

パフォーマンスの向上

エッジケースのパフォーマンスを3倍向上させ、集約モデルのパフォーマンスを最大20%高速化。

主要コンポーネント

迅速なシーン生成

自然言語シナリオ生成、Synthetic Datasetsの分布ベースのドメインランダム化フレームワークを使用、または実世界のログからシーンを抽出して補強することで、合成データセットを簡単に定義し、大規模に生成できます。データセットがタスクのドメインと一致し、特定のエッジケースをターゲットにするように分布を直接制御し、トレーニング中のドメインギャップが最小になるように設計します。

センサーシミュレーション

Synthetic Datasetsは、Applied IntuitionのSensor Simの機能に基づいて構築され、合成データが物理的に正確で、ターゲットセンサーとタスクドメインを表現していることを保証します。機械のデータの見方は人間とは異なるため、合成データセットは機械がデータのトレーニングから価値を得るために必要な多様性とリアリズムを備えています。

ラベル生成

単純なバウンディングボックスやキューボイドから、オプティカルフローや深度のような高密度なラベルまで、グランドトゥルースラベルをプログラムで生成します。既存のデータセットやMLパイプラインとのシームレスな統合を確実にするために、分類法、オントロジー、ラベリング仕様に合わせてラベルをカスタマイズします。

ドメイン適応

実世界の訓練データセットに基づいたドメイン適応を使用します。タスクドメインに合わせて生成的アルゴリズムと古典的アルゴリズムの組み合わせにより合成データを再スタイリングまたは修正し、合成データセットがML対応システムに最大限の価値を提供できるようにします。

スケーラブルなインフラ

Applied IntuitionのCloud Engine活用すれば、何千もの並列シミュレーションをオーケストレーションし、量産規模のデータセットを数時間で生成できます。

主要コンポーネント

迅速なシーン生成

自然言語シナリオ生成、Synthetic Datasetsの分布ベースのドメインランダム化フレームワークを使用、または実世界のログからシーンを抽出して補強することで、合成データセットを簡単に定義し、大規模に生成できます。データセットがタスクのドメインと一致し、特定のエッジケースをターゲットにするように分布を直接制御し、トレーニング中のドメインギャップが最小になるように設計します。

センサーシミュレーション

Synthetic Datasetsは、Applied IntuitionのSensor Simの機能に基づいて構築され、合成データが物理的に正確で、ターゲットセンサーとタスクドメインを表現していることを保証します。機械のデータの見方は人間とは異なるため、合成データセットは機械がデータのトレーニングから価値を得るために必要な多様性とリアリズムを備えています。

ラベル生成

単純なバウンディングボックスやキューボイドから、オプティカルフローや深度のような高密度なラベルまで、グランドトゥルースラベルをプログラムで生成します。既存のデータセットやMLパイプラインとのシームレスな統合を確実にするために、分類法、オントロジー、ラベリング仕様に合わせてラベルをカスタマイズします。

ドメイン適応

実世界の訓練データセットに基づいたドメイン適応を使用します。タスクドメインに合わせて生成的アルゴリズムと古典的アルゴリズムの組み合わせにより合成データを再スタイリングまたは修正し、合成データセットがML対応システムに最大限の価値を提供できるようにします。

スケーラブルなインフラ

Applied IntuitionのCloud Engine活用すれば、何千もの並列シミュレーションをオーケストレーションし、量産規模のデータセットを数時間で生成できます。

合成データセットを始める

データサンプルをリクエストいただき、Synthetic DatasetsがADASとADのためのMLトレーニングをどのように加速できるかをご確認ください。