課題

APSは、多様な運行設計領域(ODD)内でうまく機能しなければならないため、高性能な認識モデルが必要となります。しかし、正確なラベルと十分な多様性を持つトレーニングデータを見つけることは難しいです。実世界のデータを大量に収集することは、時間がかかり、コストがかかり、危険でさえあります。手作業によるデータのラベリングは、モデルの不具合を特定してから新しいデータで再トレーニングするまでに、さらなるコストと遅延が発生します。

なぜParking Datasetsなのか?

Applied IntuitionのParking Datasetsは、MLエンジニアがロバストな認識モデルを開発するのに役立ちます。

新しいMLモデルをブートストラップし、駐車場ユースケースのためのマルチモーダル、マルチセンサー・ラベル付きトレーニングデータにより既存のトレーニングデータの補完し、ODD要素を変化させ、希少なクラスをターゲットにすることで、クラスの不均衡に対処します。

駐車場のODDを新しいロケーションに拡張し、オプティカルフローのような実データから得ることが困難な、高密度のピクセル単位のラベルでトレーニングします。

メリット

カバレッジの拡大

ODDを拡張して、既存のトレーニングデータセットに含まれていない要素を含める。合成データを活用し、データの希少性の問題やクラスの不均衡をターゲットとして、エッジケースに対処

モデル性能の向上

合成データでMLモデルをトレーニングし、ロングテールケースのパフォーマンスを最大3倍向上

イテレーションを高速化

実データを合成データセットで補うことで、テストや本番で障害が発生した場合に、新しいトレーニングデータセットの収集とラベリングにかかるサイクルタイムとコストを削減

主要コンポーネント

センサーモデル

検証済みのハードウェア固有センサーモデルから生成された物理的に正確な合成データ

グランドトゥルースラベル

業界標準フォーマットのエラーフリーのグランドトゥルースラベル

ドメインギャップを最小限に抑える

センサーや材料の挙動を調整するためのパラメータや、合成特有の特徴を取り除くためのドメイン適応によって、シミュレーションと実世界ドメインのギャップを緩和

環境変化

駐車場のマーク、素材、車両、VRU、その他のODD要素に何千ものバリエーションがある、手続き的に生成された駐車場構造

シーンの多様性

多様性を最大化し、特定のエッジケースをターゲットにするために、環境、天候、照明などのすべてのシーンコンポーネントに対して分布を直接定義

グローバルカバレッジ

地域は、アメリカ、カナダ、ヨーロッパ、日本、中国、韓国など

Parking Datasetsを使ってみましょう

データサンプルを申請して、Parking DatasetsがAPS開発のためのMLトレーニングをどのように加速させるかをご確認ください。