На этой неделе: главные события в сфере ИИ
1. DeepMind представляет ИИ-систему обучения от человека
Google DeepMind представила инновационную систему ИИ-агентов, способную обучаться сложным задачам напрямую от человеческих инструкторов. В революционной статье, опубликованной в журнале Nature, исследователи вводят метод, называемый культурной передачей, который позволяет модели ИИ приобретать навыки без использования заранее собранных данных человека. Этот новый подход близок к тому, как люди учатся через наблюдение, словно следуя видеоуроку. С помощью уникального процесса подражания с минимальным количеством примеров, демонстрируемого в симулированной среде GoalCycle3D, ИИ-агент успешно имитировал действия человека, продемонстрировав впечатляющую память о задачах даже спустя длительное время после демонстрации. DeepMind утверждает, что эта техника закладывает основу для интеграции культурной эволюции в разработку искусственного общего интеллекта, значительно продвигая эту область.
2. Подготовка к революции на рынке труда с ИИ
В проницательной колонке Сета Добрина, основателя и CEO Qantm AI, обсуждается, как организации и сотрудники могут активно использовать достижения ИИ. Учитывая стремительное развитие технологий, сегодняшним работникам необходимо пересматривать свои навыки и быстро адаптироваться к экономике, движимой ИИ. Добрин подчеркивает настоятельную необходимость в обновлении образовательных систем, корпоративных программ обучения и государственных политик в соответствии с этими изменениям. Влияние генеративного ИИ охватывает все сектора, затрагивая как физический труд, так и офисные профессии. Координированные действия различных заинтересованных сторон необходимы для подготовки к этому преобразующему периоду и минимизации разрушительных последствий на рынке труда.
3. Google запускает Gemini: мощную новую языковую модель
Google официально запустила свою долгожданную языковую модель следующего поколения Gemini, которая считается самой большой и мощной из представленных. После периода ожидания Google представила подробные сведения о Gemini, которая доступна в трех конфигурациях: Ultra, Pro и Nano, что позволяет использовать модель на устройствах от мобильных телефонов до дата-центров. Gemini Pro теперь поддерживает чат-бота Google Bard, улучшая его возможности рассуждения и понимания. В начале 2024 года Google планирует представить Bard Advanced с дополнительными функциями. Начиная с 13 декабря, разработчики и корпоративные пользователи смогут получить доступ к Gemini Pro через API Gemini на Vertex AI и Google AI Studio.
4. Audiobox от Meta: преобразование текста в уникальные звуки
Meta запустила Audiobox, свою последнюю модель ИИ, предназначенную для генерации аудио, которая переводит текст в звук. В отличие от своего предшественника Voicebox, Audiobox позволяет пользователям описывать желаемый аудиотрек с помощью естественных языковых запросов. Например, ввод "бобер, жующий кусок ананаса" создает уникальный звуковой пейзаж на основе этого описания. Кроме того, модель может синтезировать аудиофайлы, комбинируя текстовые запросы с голосовыми вводами, предлагая пользователям больший контроль над стилем и звуковыми эффектами создаваемого аудио — такой функции не было в ранних моделях. Ознакомьтесь с образцами аудио на исследовательском сайте Meta.
5. Стратегическая покупка чипов OpenAI у Rain AI
OpenAI подписала значительное соглашение на сумму 51 миллион долларов о приобретении ИИ-чипов у Rain AI, стартапа, сооснователем которого является CEO Сам Альтман. Это сотрудничество основано на передовых нейроморфных технологиях обработки, направленных на воспроизведение работы человеческого мозга. Предыдущие взаимодействия OpenAI с Rain начинаются с 2019 года, что подчеркивает давнюю партнерскую связь в области инноваций. Несмотря на недавние внутренние споры вокруг Альтмана, сделка призвана улучшить возможности OpenAI, при этом Rain ожидает поставку первой партии оборудования к октябрю 2024 года.