ME News ニュース、4月15日(UTC+8)、動察Beatingの監視によると、AIデータプラットフォームAdaption Labsは新機能「Expand Your World」を発表しました。単一言語の最少10サンプルから、242の言語と地域変種をカバーする最大2,420の高品質トレーニングサンプルを生成でき、追加のアノテーションやデータパイプラインは不要です。この機能はすべてのAdaptive Dataユーザーに公開されています。 多言語カバーはAIトレーニングデータの主要な短所の一つです。ほとんどのデータセットは少数の高リソース言語に集中しており、モデルの少数言語や地域方言の処理能力は著しく弱く、後の微調整では完全に補えません。Adaption Labsの考えは、言語カバー範囲をデータ層に前倒しし、トレーニングデータ生成段階で分布偏差を解決することです。 Adaption Labsは、前Cohere研究副社長のSara Hookerと前Google AIインフラエンジニアのSudip Royが共同設立し、今年2月にEmergence Capitalがリードした5000万ドルのシードラウンド資金調達を行い、評価額は10億ドルです。同社のコアな投資は、効率的な適応システムを用いて暴力的な拡張に代わり、モデルが継続的に学習・進化できるようにすることです。(出典:BlockBeats)
10のサンプルを242の言語に拡張、Adaption Labsはデータ層からAIの多言語課題を解決します
ME News ニュース、4月15日(UTC+8)、動察Beatingの監視によると、AIデータプラットフォームAdaption Labsは新機能「Expand Your World」を発表しました。単一言語の最少10サンプルから、242の言語と地域変種をカバーする最大2,420の高品質トレーニングサンプルを生成でき、追加のアノテーションやデータパイプラインは不要です。この機能はすべてのAdaptive Dataユーザーに公開されています。 多言語カバーはAIトレーニングデータの主要な短所の一つです。ほとんどのデータセットは少数の高リソース言語に集中しており、モデルの少数言語や地域方言の処理能力は著しく弱く、後の微調整では完全に補えません。Adaption Labsの考えは、言語カバー範囲をデータ層に前倒しし、トレーニングデータ生成段階で分布偏差を解決することです。 Adaption Labsは、前Cohere研究副社長のSara Hookerと前Google AIインフラエンジニアのSudip Royが共同設立し、今年2月にEmergence Capitalがリードした5000万ドルのシードラウンド資金調達を行い、評価額は10億ドルです。同社のコアな投資は、効率的な適応システムを用いて暴力的な拡張に代わり、モデルが継続的に学習・進化できるようにすることです。(出典:BlockBeats)