Диалог с основателем Chance AI: увидеть другую сторону мира, выйти за пределы стен «однородности больших моделей»

在 нынешней беспрецедентной по масштабу конкуренции в сфере ИИ «большие модели» стали ответом по умолчанию для всех компаний. Все наращивают вычислительные мощности, устраивают гонки за лидерство и захватывают всевозможные точки входа. Однако как отраслевое повествование все больше сводится к одному руслу, появилась стартап-компания, которая почти все распространенные подходы отвергает — Chance AI.

Основатель Сэн Си когда-то удалил поле ввода с главной страницы и сделал AI-приложение, которому не нужно, чтобы ты задавал вопросы: достаточно поднять руку и щелкнуть, и оно сможет с помощью текста интерпретировать всё, что ты видишь — это более интуитивно.

На месте Сэн Си показал изображение пары кроссовок Air Jordan 1, и Chance AI сказал нам, что они стоят 300 тысяч долларов. Почему? Потому что именно та пара была в финале, который проходил при Джордане. А еще оно помогает девушкам разбирать образы. Перед выходом сделать селфи — и приложение подскажет ей: если поменять цвет шарфа в этом комплекте, или добавить сумку какого-то цвета, то сочетаемость будет выше.

Очень скоро, после того как команда завоевала популярность среди студентов в Северной Америке, они, откликаясь на голос молодого поколения, разработали целый ряд функций: оценка OOTD (ежедневных образов), чтение по руке, анализ качества кожи, язвительные комментарии к стилю и многое другое.

Если одной лишь интерпретации было недостаточно, пользователи могли одним нажатием делиться в сообществе, встроенном в Chance AI: «увиденное» превращалось в повод для разговора пользователя, и так вместе собралась группа 18–25-летних молодых людей.

CTO У Сяофань рассказал порталу «Wall Street China» (华尔街见闻), что Chance AI уже привлек примерно 250 тысяч пользователей по всему миру.

Так постепенно складывается форма, похожая на Google Lens + Xiaohongshu, Instagram: Chance AI также в общих чертах собрал ключевые элементы хита. И чем больше молодежь использует его, тем лучше оно улавливает их реальные потребности: Сэн Си сказал: «У нас около 200 с лишним тысяч пользователей, и в среднем каждая девушка в Северной Америке каждый день снимает 2,8 раза образов — насколько же это ужасающе большой объем данных».

Имея в руках золотую жилу, о которой мечтают большие компании и e-commerce, У Сяофань и команда, однако, не спешили монетизировать и не собирались вслепую гнаться за модой на AI-железо, которая сейчас в тренде. Более того, они даже временно не решались на более масштабную рекламную кампанию — боялись, что инфраструктура временно не выдержит «реку богатства, что польется с неба».

Они намерены продолжать шлифовать собственный визуальный агент, сделать этот «визуальный мозг» еще более мощным, тем самым накапливать более богатые данные, формировать визуальное сообщество и ускорять эффект «катящегося снежного кома».

В условиях, когда AI-продукты постепенно становятся однотипными, Сэн Си оказался в числе немногих, кто ушел от мейнстримного нарратива. Но он выкопал общее для людей понимание интуиции: если 70% пропускной способности человеческого мозга уходит на обработку визуальной информации, то следующая точка входа для ИИ не должна дальше монополизироваться одним полем ввода.

Выбор Chance AI, возможно, радикальный, но именно в отрасли, где все сильнее «сжигают» друг друга, он тем более заслуживает наблюдения из-за своей дефицитности.

Вернуть взаимодействие к визуальному инстинкту

Когда отрасль уже привыкла определять границы продукта через модель «человек задает вопрос — ИИ отвечает», Сэн Си, основатель Chance AI, в интервью «Wall Street China» задал вопрос: «Почему глаза не растут на попе?»

Потому что логика эволюции человека считает зрение первичным принципом, а язык — лишь более поздней системой кодирования.

Сэн Си отметил: с точки зрения эволюции в человеческом мозге около 70% обработки информации связано с визуальной сферой — еще до появления языка люди уже полагались на зрение, чтобы распознавать окружающую среду, оценивать опасность и возможности.

За последние десять лет все основные способы взаимодействия были стандартизированы полем ввода. Пользователи должны заранее понимать, в чем вопрос; должны переводить потребность в язык; затем отдавать язык модели.

Для большинства людей это неестественно. Когда человек на улице видит необычное здание, незнакомое искусство или размытый символ, первая реакция — «его привлекло», а вопрос возникает уже после того, как привлекло внимание.

Сэн Си сказал: «Подсказки (prompt) предназначены для ленивого ИИ».

Он имел в виду не атаку на prompt-экосистему. Он считает, что в большинстве случаев prompt — это человек, который помогает модели работать, подставляя и дополняя цепочку рассуждений, которой не хватает модели. Если ИИ правда достаточно умен, ему не следует зависеть от того, что люди учат его «как спрашивать» — он должен уметь, опираясь на визуальные подсказки, активно понимать, на чем сосредоточен пользователь.

Сэн Си рассказал в интервью «Wall Street China» историю. Он сказал, что он любитель искусства. Два года назад он сделал небольшую программу для AI-сканирования и объяснений — как инструмент к выставке. Однако после того как выставка завершилась, Сэн Си обнаружил, что этим приложением продолжает пользоваться еще более 1500 человек. После исследований он выяснил: у этих пользователей уже сформировалась мышечная память — они используют приложение, чтобы сканировать разные растения и цветы, фильмы, одежду, и продолжают общаться с ИИ.

По сути, в нем очень силен ответственный настрой дизайнера: «Наша миссия — устранить разрыв между технологиями и людьми. Для многих ИИ может казаться немного „сдержанным“, но моя цель — сделать его более естественным, более близким к человеческим инстинктивным потребностям — понимать и исследовать мир с помощью зрения».

На основе этого решения напрямую определяется форма продукта. Chance AI с первого дня убрал поле ввода с центрального интерфейса.

«Смотреть» стало действием по умолчанию, а «спрашивать» — опциональным. Пользователю не нужно организовывать язык, не нужно заранее конструировать вопрос, и не нужно прилагать усилия, чтобы искать «самый любимый способ вопроса для AI». В то время как почти все в отрасли усиливают языковое взаимодействие, это решение выглядит крайне против течения.

Но именно поэтому оно обходит большую часть дорожек, по которым модели толпятся вместе. Поле ввода — это про целеустремленность, а зрение — про инстинкт; поле ввода подчеркивает решение задач, а зрение — запуск любопытства. По способу взаимодействия Chance AI больше похоже не на инструмент, а на тренировку когнитивной «мышцы».

Однако у первопроходцев тоже есть риски. Сейчас отрасль уже выстроила полноценный пользовательский путь вокруг языкового взаимодействия: от поиска до e-commerce и до режима ассистента — пользователей тоже тренируют все больше полагаться на «задавать вопросы».

Неясно, сможет ли зрение действительно стать новой точкой входа, да и аппаратная форма еще не созрела. Но в условиях очень унифицированного рынка Chance AI, по крайней мере, пытается сделать вопрос снова открытым, а не продолжать, как все остальные, сжимать взаимодействие в одно поле.

От распознавания — к смысловому рассуждению

То, в чем Chance AI действительно отличается от консенсуса, заключается не в том, что он использует камеру, а в том, что он считает «объяснение смысла» ключевой способностью ИИ.

Сэн Си говорит, что вдохновение основать Chance AI восходит к детскому просмотру «Моны Лизы». «Когда я стоял перед ней — она была в масштабе, который казался гораздо меньше, чем в воображении, — я был полон ожиданий, но полностью не понимал, в чем там смысл. „Ну это же просто маленькая картина — что в ней особенного?“, взглянул мельком и ушел».

«Люди — визуальные животные и также рассказные животные: нас изначально тянет к тому, что мы видим перед собой, но по-настоящему трогает нас то, что стоит за этим — история». Позже, когда у Сэн Си появилась возможность глубже разобраться в Леонардо да Винчи и в истории, стоящей за этой картиной, он наконец понял, почему ее называют сокровищем человеческой цивилизации.

Сэн Си говорит, что миссия Chance AI — с помощью технологий помогать людям находить эти скрытые истории и устранять разрыв между человеком и миром. Что касается названия «Chance», то оно обозначает не только «возможность», но и «случайность» (contingency).

По его мнению, процесс биологической эволюции опирается на случайность, а рождение человеческих знаний и креативности тоже часто берет начало из этих случайных столкновений. Chance AI надеется связать зрение и истории, ускоряя пересечение этих знаний, чтобы каждое визуальное переживание становилось более глубоким и более значимым.

Если оглянуться назад, за последний год вся отрасль заметно продвинулась в сторону мультимодальности: основные модели стали точнее распознавать изображения, аннотировать и описывать. Однако, считает Сэн Си, у всех этих возможностей почти один общий потолок: они могут объяснить «что это такое», но сложно дальше объяснить «почему это важно».

Понимание мира человеком никогда не ограничивается уровнем фактов. Будь то разбор фильмов, комментарии к матчу, туристические маршруты или объяснения искусства — люди нуждаются в таких ролях, потому что они помогают нам превращать факты в смысл, декомпрессировать информацию в истории и связывать то, что мы видим, с более широкой культурной системой. В этом смысле зрение — это способ рассуждения.

Продукт Chance AI здесь делает очевидный выбор. Он не удовлетворяется тем, чтобы дать объективное описание, а пытается задействовать фоновые знания об объекте, культурный контекст и социальный консенсус.

Сэн Си привел пример в интервью «Wall Street China»: камень больше не «глыба, лежащая на бетоне», а LevitatedMass из LACMA в Лос-Анджелесе; это общественное произведение искусства, на транспортировку которого ушло 13 миллионов долларов; и это метафора о структуре городских слоев в США. Здание — не просто «небоскреб в стиле футуризма», а одно из наследий Заха Хадид; и это символ бутонизации гингко (紫荆花含苞待放).

Такие объяснения не генерируются автоматически моделью — это активное смысловое рассуждение. Его предпосылка в том, что модель готова вмешиваться, готова объяснять и готова пойти на определенный уровень субъективного риска. Именно этого больше всего не хочет делать большинство мейнстримных моделей.

В отраслевых кругах считают, что стратегии моделей больших компаний крайне консервативны: они скорее дают безопасную, стандартизированную и не вызывающую споров информацию. А само «объяснение» несет в себе субъективность и значит — потенциальный конфликт интересов и споры, что для крупного коммерческого продукта увеличивает риск.

Вот почему «смысловое рассуждение» постоянно остается серой зоной отрасли. То, что большие компании не делают это, не значит, что они не могут — скорее, это может привести к росту затрат. Позиционирование Chance AI дает ей возможность брать на себя такие «неопределенные объяснения», и позволяет ей продвигаться по пути «визуального понимания» дальше, чем другие.

Но у такой модели есть и очевидные ограничения. Культурный контекст может смещаться, нарратив о смысле может превратиться в новую «AI-аферу а-ля гадание». Чем дальше модель идет в сторону объяснений, тем больше ей нужно искать баланс между глубиной и точностью. Для больших компаний это риск, который нельзя брать; для Chance AI это — обязательная граница.

Но именно потому, что она находится в зоне, куда гиганты больше всего не хотят заходить, она располагает редким окном времени. Она пытается ответить на вопрос: «может ли ИИ улучшить способность человека понимать». И она действительно попадает в потребности части людей: в мире, переполненном информацией, суждения более редки, чем ответы; понимание важнее скорости.

Проблема Chance AI в том, что ее маршрут требует терпения, требует экосистемы, требует железа и требует переноса культурных привычек. Ее преимущество в том, что она раньше других осознала: следующее изменение точки входа ИИ может произойти в сфере визуального.

В эпоху, когда все компании делают ставку на языковые модели, это решение выглядит одиноким — но именно поэтому его стоит фиксировать.

Предупреждение о рисках и условия отказа от ответственности

        На рынке есть риски, инвестиции требуют осторожности. Данная статья не является индивидуальной инвестиционной рекомендацией и не учитывает особые инвестиционные цели, финансовое положение или потребности отдельных пользователей. Пользователям следует рассмотреть, соответствуют ли любые мнения, взгляды или выводы в данной статье их конкретной ситуации. В соответствии с этим инвестирование осуществляется на ваш собственный риск, ответственность на вас.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить