unilm.bundle 内の多くのファイルは macOS Ventura (13.5) には存在せず、新しいバージョンの macOS Sonoma ベータ (14.0) にのみ表示されます。
unilm.bundle には sp.dat ファイルがあり、Ventura と Sonoma の両方のベータ版にありますが、Sonoma のベータ版は明らかにトークナイザーのように見えるトークンのセットで更新されています。
sp.dat 内のトークンの数は、unilm.bundle 内の 2 つのファイル (unilm_joint_cpu.espresso.shape および unilm_joint_ane.espresso.shape) と一致します。これら 2 つのファイルは、Espresso/CoreML モデルの各レイヤーの形状を記述します。

さらに、unilm_joint_cpu で説明されているネットワーク構造に基づいて、Apple モデルは GPT-2 アーキテクチャに基づいていると推測しました。

主にトークンの埋め込み、位置エンコーディング、デコーダーブロック、出力層が含まれており、各デコーダーブロックには gpt2_transformer_layer_3d のような単語が含まれます。

** **### △出典: ジャッククックのブログ投稿

また、各層のサイズに基づいて、Apple モデルには約 3,400 万のパラメータがあり、隠れ層のサイズは 512 であると推測しました。つまり、GPT-2 の最小バージョンよりも小さいです。

これは主に、消費電力が少なく、高速かつ頻繁に実行できるモデルを Apple が望んでいるからだと思います。

WWDC での Apple の公式声明は、「キーがクリックされるたびに、iPhone はモデルを 1 回実行する」というものです。

ただし、これは、このテキスト予測モデルが文や段落を完全に継続するのがあまり得意ではないことも意味します。

** **### △出典: ジャッククックのブログ投稿

モデルアーキテクチャに加えて、Cook はトークナイザーに関する情報も調査しました。

彼は unilm.bundle/sp.dat で 15,000 個のトークンのセットを見つけました。これには 100 個の絵文字が含まれていることに注目してください。

クックがクックを明かす

このクックは料理人ではありませんが、私のブログ記事は公開されるやいなや、依然として多くの注目を集めました。

彼の発見に基づいて、ネチズンはユーザーエクスペリエンスと最先端のテクノロジーアプリケーションのバランスを取るためのAppleのアプローチについて熱心に議論しました。

ジャック・クック自身の話に戻りますが、彼はマサチューセッツ工科大学でコンピューターサイエンスの学士号と修士号を取得し、現在オックスフォード大学でインターネット社会科学の修士号取得に向けて勉強しています。

以前は NVIDIA でインターンとして、BERT などの言語モデルの研究に重点を置いていました。彼は、ニューヨークタイムズ紙の自然言語処理の上級研究開発エンジニアでもあります。

それで、彼の啓示はあなたの中にいくつかの考えを引き起こしましたか？コメントエリアであなたの意見を共有することを歓迎します~

元のリンク:

原文表示

このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております（表明・保証をするものではありません）。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。

1 いいね

コメントを追加

コメントなし

iPhone のトランスフォーマーを明らかに: GPT-2 アーキテクチャに基づいた単語セグメンターには、MIT 卒業生が作成した絵文字が含まれています