"AUDIO"検索結果
06:18

Kimiは新しい汎用オーディオ基盤モデルKimi-Audioを発表しました

Jin10データ4月26日、今日、Kimiは新しいオープンソースプロジェクト——新しい汎用オーディオ基盤モデルKimi-Audioを発表しました。紹介によると、このモデルは音声認識、音声理解、音声からテキストへの変換、音声対話など多様なタスクをサポートしています。
もっと
AUDIO-0.97%
03:22

Alibaba Tongyiのオープンソースオーディオ言語モデルであるQwen2-AudioがACL 2024に選ばれました

金十データ8月13日のニュースによると、アリババは通義大モデルを引き続きオープンソース化し、Qwen2シリーズオープンソースファミリーに音声言語モデルQwen2-Audioを追加しました。Qwen2-Audioはテキスト入力なしで直接音声での質問応答が可能で、ユーザーの音声信号(会話、自然音、音楽など)を理解し分析します。このモデルは複数の権威ある評価で以前の最高モデルを大幅に上回っています。通義チームはさらに新しいオーディオ理解モデルのベンチマークテストを同時に発表し、関連論文は今週開催されている国際会議ACL2024に採択されました。
AUDIO-0.97%
  • 3
03:40
Pinwan氏によると、Arxivのページには、Alibabaが最近Qwen-Audioという音声言語モデルをリリースしたことが示されている。 このモデルは、音声言語の事前学習を拡張して、30以上のタスクと、人間の声、自然の音、音楽、歌などのさまざまな音声タイプをカバーすることで、普遍的な音声理解を実現するように設計されています。 調査によると、Qwen-Audioは、タスク固有の微調整を必要とせずに、幅広いベンチマークタスクで大幅なパフォーマンスを達成しています。
AUDIO-0.97%
05:16
10月24日、タイム誌は、私たちの生活を変える200のイノベーションを含む「ベストインベンション2023」リストを発表しました。 その中から、AdobeのPhotoshopのGenerative ExpandとGenerative Fill、OpenAIのGPT-4とDall-E 3、Runway Gen-2、Meta SeamlessM4T、Stable Audioなど、AIの分野で合計14のプロジェクトが選ばれました。
13:49
TechCrunch によると、9 月 13 日、Stability AI は人工知能音楽ジェネレーターである Stable Audio の発売を発表しました。 Stable は、これが潜在拡散と呼ばれる技術を通じて商用目的で「高品質」の 44.1 kHz 音楽を作成できる最初のツールであると主張しています。スタビリティ氏は、オーディオ ファイルの長さと開始時間だけでなく、オーディオ メタデータをトレーニングすることにより、以前にリリースされた生成音楽ツールと比較して、Audio Diffusion の基礎となるモデルには約 12 億のパラメータがあり、オーディオのコンテンツとコンテンツを合成できると述べました。間隔。 1 年前、Stability AI はひっそりと Dance Diffusion をリリースしましたが、その後、Stability AI がモデルの作成に資金を提供した研究機関 Harmonai が Dance Diffusion の更新を停止しました。本日発売されたStable AudioはHarmonaiだけが開発したものではありません。 4 月に正式に立ち上げられた Stability のオーディオ チームは、Stable Audio の基礎として Dance Diffusion からインスピレーションを得た新しいモデルを作成し、その後 Harmonai によってトレーニングされました。現在、Stable Audio は Web アプリを通じてのみ利用できます。また、Stability は、Stable Audio の背後にあるモデルをオープンソースとしてリリースする計画も発表していません。
  • 1
19:36
キム・アーゼンドルフ: 催眠術をかけるために設計された NFT アートを作成するメタリカのビデオ ディレクター デジタル表現主義者でありインターネットアート出身のキム・アーゼンドルフは、最新のNFTドロップ「Colors of Noise」を明らかにしました。 Feral File プラットフォーム用に Peggy Schoenegge によってキュレーションされた、50 点のユニークなアートワークのシリーズは、それぞれ 0.25 ETH で入手できます。 Asendorf は、Web Audio API を使用してホワイト ノイズを生成し、アニメーションを作成することで、彼のキャリアで初めてビジュアル アートとオーディオ アートを組み合わせました。
もっと詳しく
人気タグ

最新のトピック

もっと

暗号資産カレンダー

もっと
トークンのロック解除
Aptosは10月11日に11,310,000 APTトークンをロック解除し、現在の流通供給量の約2.15%を占めます。
2025-10-10
トークンのロック解除
Aethirは10月12日に1,260,000,000 ATHトークンを解放し、現在の流通供給量の約12.73%を占めます。
2025-10-11
1.26B トークン アンロック
Aethirは午前10時UTCにトークンを解除します。
2025-10-11
プロジェクトの最新情報
Coinbaseは10月14日から17日まで、すべてのMATICトークンをPOLにアップグレードします。移行期間中、MATICをステークしても報酬は累積されません。
2025-10-14
ハッカソン
Pi Networkは正式にPiハッカソン2025を開始しました。これは、オープンネットワークのデビューに続く最初の主要な開発者チャレンジです。このハッカソンは、開発者に対して、実世界のユーティリティを提供し、エコシステムを進化させるPi搭載アプリケーションを設計・発表することを求めています。総賞金プールは160,000 Piです。Pi2Day 2025からの革新の勢いを基に、この競技は、日常的に使用するツールから全く新しいアプリの概念に至るまで、幅広いユーティリティ主導のアイデアを奨励します。すべての提出物はメインネット上場要件を満たし、Piコミュニティに具体的な価値を提供する必要があります。インセンティブと賞品:1位:75,000 Pi 2位:45,000 Pi 3位:15,000 Pi 最大5件の名誉ある言及:各5,000 Pi 重要な日程:8月15日:登録開始およびチーム編成開始 8月21日:ハッカソン正式開始 9月19日:中間チェックイン(オプションですが、メンターシップと露出を得る可能性があります) 10月15日:アプリの上場およびデモビデオを含む最終提出物の締切 開発者は、Pi App Studio、Brainstorm、開発者ポータル、オープンソースリソース(PiOS)、およびAIツールを活用して、アイデアを構築および洗練することを奨励されています。
2025-10-14
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)