Кремниевая долина готовится к тихой революции. Пока мир спорит о возможностях генеративных нейросетей, секретная лаборатория ИИ Hark, основанная серийным предпринимателем Бреттом Эдкоком, предлагает принципиально иной подход.
Речь идет не просто о создании очередной языковой модели, а о рождении новой философии взаимодействия человека и машины. Центральным понятием здесь становится персональный интеллект — система, которая не ждет команд, а живет в симбиозе с пользователем.
В эксклюзивном заявлении для TechCrunch компания раскрыла амбициозные планы: разработка мультимодальных комплексных моделей, специализированного аппаратного обеспечения и интерфейсов будет вестись в тандеме.
Цель — создать бесшовный комплексный продукт для персонального интеллекта. Это означает, что программное обеспечение больше не будет зашито в существующие цифровые платформы, а станет основой, на которой строится весь пользовательский опыт. Система сможет хранить данные о вашей жизни, слышать, видеть и взаимодействовать с окружающим миром в реальном времени.
Почему существующие устройства больше не работают?
Главный дизайнер Hark, Абидур Чоудхури, чье резюме украшает работа над iPhone Air в Apple, предельно критичен к текущему положению дел.

Современные устройства по сути своей не имеют ничего общего с искусственным интеллектом. Мы по-прежнему пользуемся смартфонами, архитектура которых была заложена десятилетия назад, а ИИ-функции являются лишь надстройкой — приложениями или веб-сайтами на верхнем уровне.
Абидур Чоудхури
Это создает парадоксальную ситуацию: чем мощнее становятся модели, тем более примитивным кажется интерфейс их вызова. Пользователи вынуждены тратить вечера на рутинные задачи: заполнение форм, бронирование билетов, синхронизацию данных между устройствами. Чоудхури отмечает, что современный пользовательский опыт (UX) застрял в прошлом.
Традиционный пользовательский опыт всегда сводится к тому, чтобы найти самое простое решение для всех. Пользовательский опыт будущего будет заключаться в том, чтобы найти то, что подходит каждому конкретному человеку.
Абидур Чоудхури
Отказ от носимых устройств
В отличие от многих игроков рынка (вспомните очки Meta или броши с камерами), Hark занимает принципиальную позицию. По словам Чоудхури, компания не верит в носимые ИИ-платформы, которые вклиниваются между человеком и привычными интерфейсами. «Мне так же не по себе от булавок и прочих штуковин с камерами», — заявляет дизайнер.
Что же тогда предложит Hark?
Точных деталей пока нет, но судя по намекам, компания работает над созданием нового класса устройств, где ИИ будет не функцией, а операционной средой. Это могут быть стационарные или мобильные хабы, которые не требуют от пользователя изменения привычек, но берут на себя управление рутиной.
Акцент на элегантности и простоте неизбежно вызывает ассоциации с эпохой Джони Айва, который сегодня занимается аппаратным обеспечением для OpenAI.
Синергия с робототехникой и вычислительные мощности
Одним из самых интригующих аспектов стратегии Hark является тесная интеграция с другими активами Бретта Эдкока. Модели Hark уже обучаются на роботах Figure — человекоподобных машинах, созданных той же экосистемой. Хотя официально объединения компаний не планируется, эта синергия позволяет тестировать модели в физическом мире, а не только в цифровой среде.

Уже в апреле Hark начнет использовать новый кластер из тысяч графических процессоров NVIDIA. Это даст команде из 45 инженеров и дизайнеров (бывших сотрудников Meta, Apple и Tesla) необходимые вычислительные мощности для обучения мультимодальных моделей.
Объем инвестиций на старте составил 100 миллионов долларов личных средств Эдкока, что подчеркивает серьезность намерений.
Как работает мультимодальность?
Чтобы понять, как персональный интеллект сможет видеть, слышать и предугадывать действия, стоит обратиться к архитектуре мультимодальных моделей. В отличие от традиционных LLM (больших языковых моделей), работающих только с текстом, мультимодальные системы объединяют в себе обработку визуальной, аудиальной и текстовой информации.
Если представить себе архитектуру такого ИИ, она будет состоять из нескольких ключевых блоков:
- Энкодеры для преобразования видео, звука и текста в единое векторное пространство (эмбеддинги).
- Трансформерная сеть, которая обрабатывает этот поток данных, отслеживая взаимосвязи между тем, что пользователь говорит, что делает и что происходит вокруг.
- Модуль планирования (Agentic Framework), который не просто генерирует ответ, а выполняет последовательность действий (например, бронирование столика через API ресторана, синхронизацию с календарем и отправку уведомления).
Визуализация данных в Colab
Для наглядности того, как мультимодальные модели обрабатывают данные и почему им требуются тысячи GPU, предлагаю рассмотреть простые, но показательные графики. Эти графики помогут читателям визуализировать принципы работы персонального интеллекта.
Сравнение сложности обучения (Uni-modal vs Multi-modal)
График показывает, почему для создания бесшовного продукта требуется экспоненциально больше данных и вычислительных ресурсов, чем для обычного текстового чат-бота.

Эффективность решения рутинных задач (Имитация работы агента)
График моделирует, как «персональный интеллект» (Agentic AI) сокращает время пользователя на бытовые задачи по сравнению с традиционными смартфонами.

Война за таланты и будущее рынка
Стартовый капитал в 100 миллионов долларов и доступ к передовым GPU позволяют Hark вступить в жесткую конкуренцию за лучшие умы Кремниевой долины. На рынке наблюдается любопытный тренд: крупные технологические гиганты пытаются «втиснуть» ИИ в существующие платформы, в то время как стартапы вроде Hark, OpenAI (в части разработки железа) и Tesla (роботы) пересобирают опыт с нуля.
Абидур Чоудхури признается, что когда генеративный ИИ только появился, он скептически относился к его долговечности. Однако эволюция последующих поколений моделей убедила его: мир находится на пороге изменений, сопоставимых с выходом первого iPhone.
Компания Hark планирует выпустить первые модели искусственного интеллекта уже этим летом. Если их подход окажется верным, привычные нам смартфоны и приложения могут уйти в прошлое так же, как когда-то ушли кнопочные телефоны. Вместо этого нас ждет мир, описанный Бреттом Эдкоком в служебной записке: мир Джарвиса (Железный человек) и Гер (Her) — систем, которые не просто выполняют команды, а предугадывают действия, адаптируются и «искренне заботятся» о людях.
Слово Hark означает «внимать» или «слушать». И сейчас, когда недовольство существующей цифровой жизнью достигает апогея, эта новая лаборатория предлагает нам не просто очередной гаджет, а принципиально новый способ существования человека в мире технологий — персональный интеллект, который станет фундаментом всего, к чему мы прикасаемся.
Следите за обновлениями. Конференция TechCrunch Disrupt 2026 в Сан-Франциско (13–15 октября) станет ключевой площадкой, где, вероятно, будут раскрыты многие детали этого амбициозного проекта.