Заметив цікавий парадокс у дебатах навколо ШІ: всі захоплюються тим, як впевнено і гладко говорять великі мовні моделі. Але в чому підступ — беглість мови зовсім не означає розуміння. Модель може звучати переконливо, але це не означає, що вона щось реально розуміє.



Цей парадокс нагадав мені стару ідею Платона про пещеру. Пам’ятаєте? В’язні в ланцюгах бачать лише тіні на стіні і приймають їх за реальність, бо нічого іншого не бачили. Так от, мовні моделі живуть у схожій пещері, тільки замість тіней у них текст.

Читай далі — тут найцікавіше. LLM не бачать, не чують, не торкаються реальності. Вони навчені на текстах: книгах, статтях, постах, коментарях. Це їхній єдиний досвід. Все, що вони знають про світ, приходить через фільтр людської мови. А мова — це не сама реальність, це уявлення реальності. Неповне, упереджене, часто спотворене.

Ось чому я скептично ставлюся до ідеї, що просто масштабування вирішить проблему. Більше даних, більше параметрів — це не дасть моделям справжнього розуміння. Мовні моделі чудово передбачають наступне слово, але не розуміють причинно-наслідкові зв’язки, фізичні обмеження, реальні наслідки дій. Галюцинації — це не помилка, яку можна пропатчити. Це структурне обмеження самої архітектури.

І тут з’являються world models — зовсім інший підхід. Це системи, які будують внутрішні моделі того, як працює світ. Вони навчаються не лише з тексту, а й із взаємодій, часових рядів, сенсорних даних, симуляцій. Замість питання «яке наступне слово?» вони питають «що станеться, якщо ми це зробимо?»

Це вже відбувається у реальних застосунках. У логістиці світові моделі симулюють, як збій у одному місці поширюється по всій ланцюжку поставок. У страхуванні вони вивчають еволюцію ризиків у часі, а не просто пояснюють полиси. На фабриках цифрові двійники передбачають відмови обладнання. Скрізь, де потрібна реальна передбачувальна потужність, мовні моделі виявляються недостатніми.

Цікаво, що багато компаній ще не усвідомили цей зсув. Вони продовжують інвестувати лише в LLM, думаючи, що це майбутнє. Але майбутнє — це гібридні системи, де мовні моделі стають інтерфейсом, а світові моделі забезпечують справжнє розуміння і планування.

Повернемося до Платона. В’язні звільняються не через більш уважне вивчення тіней. Вони звільняються, повернувшись і зіткнувшись із реальністю. ІІ йде в тому ж напрямку. Організації, які це зрозуміють рано, почнуть створювати системи, що дійсно розуміють, як працює їхній світ, а не просто гарно про нього говорять.

Питання в тому, чи зможе ваша компанія зробити цей перехід? Чи зможе побудувати свою світову модель? Тому що ті, хто це зробить, отримають серйозну перевагу.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити