Восход 'Автономного' компьютера: революция в технологиях и автоматизации

Поздние ночи с новорожденным могут вдохновить на замечательные инновации. Так произошло с разработчиком OthersideAI Джошем Биккеттом, который придумал инновационную "самооперационную компьютерную платформу", заботясь о своей дочери в тишине ночи.

Биккетт поделился: "Я наслаждаюсь временем с моей четырехнедельной дочерью и учусь новым урокам отцовства. В эти моменты на меня повлияло множество демонстраций GPT-4 и я понял, что наш текущий проект может использовать эту технологию."

Держат дочку на руках, Биккетт быстро набросал основу платформы на компьютере. "Я нашел первоначальную реализацию. Она еще не идеально кликает мышкой, но мы сосредоточены на главной задаче: сделать так, чтобы компьютер работал автономно."

Сооснователь и CEO OthersideAI Мэтт Шумер оценил платформу и увидел в ней огромный потенциал. "Это важный шаг к созданию самооперационных компьютеров, аналогичных самоуправляемым автомобилям. У нас есть необходимые датчики и инструменты; теперь нужно создать интеллект."

Введение в ИИ-Управление Компьютером

Биккетт уточнил, что платформа позволяет ИИ контролировать мышь и клавиатуру, функционируя автономно. "Это похоже на агента вроде autoGPT, но основано на восприятии. ИИ делает снимок экрана компьютера и решает, куда кликнуть и какие клавиши нажать, как человек."

Шумер подчеркнул, что этот подход является значительным прогрессом по сравнению с предыдущими моделями, полагающимися только на API. "Многие задачи компьютера нельзя выполнить через API, что является общим методом создания агентов. Истинная автономия требует, чтобы система взаимодействовала так, как это делают люди, поскольку компьютеры созданы для использования человеком."

Используя снимки экрана в качестве входных данных, платформа генерирует клики мышью и команды клавиатуры, имитируя человеческое взаимодействие. Однако Биккетт и Шумер признают, что настоящая сила заключается в сложных моделях компьютерного зрения и рассуждений, которые могут быть интегрированы в платформу. "Она модульная: подключи лучшую модель, и она улучшается," — отметил Биккетт.

Представление Будущего Вычислений с ИИ-Агентами

Отвечая на вопрос о будущем, Шумер описал захватывающее видение: "Как только эта технология созреет, она станет вашим основным интерфейсом для цифрового мира." С установленной самооперационной платформой продвинутые модели ИИ смогут бесшовно управлять всеми взаимодействиями с компьютером по голосовым командам.

Шумер предсказывает появление специализированных моделей ИИ-агентов, адаптированных к различным задачам. Некоторые могут акцентироваться на скорости для простых действий, в то время как другие смогут сосредоточиться на сложных рассуждениях с вариациями для корпоративного и потребительского применения. Цель, отметил он, — создать агентов, позволяющих пользователям избавиться от рутинных задач, делая вычисления accessibles even for those with limited technical skills.

Использование Открытого Исходного Кода для Ускоренной Разработки

Биккетт считает, что открытый характер платформы ускорит инновации, позволяя разработчикам по всему миру исследовать новые приложения. Шумер согласился, отметив, что "в отрасли есть множество возможностей для разнообразных поставщиков моделей и приложений, что откроет путь к росту значительных бизнесов."

Хотя оба предпринимателя видят большие возможности, достижение видения интеллектуальных компьютерных агентов потребует значительных ресурсов и постоянных инноваций. Для этого исследовательская компания ИИ Imbue (ранее Generally Intelligent) заключила партнерство с Dell на сумму 150 миллионов долларов для создания надежной платформы обучения ИИ.

Эта инициатива будет использовать внушительный кластер из около 10 000 GPU Nvidia H100, что позволит Imbue разрабатывать фундаментальные модели, оптимизированные для возможностей рассуждения. Канджун Цю, сооснователь и CEO Imbue, подчеркнул важность рассуждения: "Это основное препятствие для создания высокоэффективных агентов."

Imbue фокусируется на развитии надежного рассуждения, которое является необходимым для ИИ-агентов, чтобы ориентироваться в неопределенности, адаптировать стратегии, усваивать новую информацию и принимать сложные решения. Эти способности крайне важны для любой системы, работающей автономно в динамичных условиях.

Компания применяет комплексный подход, включающий оптимизированное обучение моделей, прототипирование агентов, разработку инструментов и теоретические исследования, все это направлено на продвижение глубокого обучения к человеческому уровню рассуждения и потенциальному искусственному общему интеллекту.

Хотя Биккетт и Шумер признают, что самооперационная платформа — это всего лишь первый шаг, они представляют себе эру трансформации, когда продвинутые ИИ-агенты кардинально заменят традиционные вычислительные интерфейсы. Поздние вдохновения могут привести к революционным прорывам, но требуемые усилия будут необходимы для реализации мечты о компьютерах, которые интуитивно работают для каждого, везде, с использованием простых языковых команд.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles