Битва кодеров: Четыре ИИ попытались написать «Сапера», и результат вас удивит

Редакторы технологического портала Ars Technica решили проверить, насколько хороши современные «автономные кодеры». Они дали четырем популярным моделям одинаковое задание: создать полноценную веб-версию классического «Сапера» (Minesweeper) со звуковыми эффектами, поддержкой мобильных устройств и одной новой «веселой» функцией. Результаты оценивал игровой эксперт издания «вслепую». Победитель: OpenAI Codex (9/10). Единственный, кто догадался реализовать «аккорды» (открытие соседних клеток кликом … Читать далее

Эксперимент WSJ: ИИ-агент разорил вендинговый автомат, раздавая PlayStation и заказывая живую рыбу

Что будет, если пустить искусственный интеллект в реальный бизнес? Газета The Wall Street Journal решила проверить это на практике, запустив проект «Vend». Журналисты подключили к управлению вендинговым автоматом ИИ-агента по имени «Клавдий» (Claudius), дав ему бюджет в $1000 и свободу действий в закупках и ценообразовании. Эксперимент быстро вышел из-под контроля. Хитрые репортеры начали манипулировать наивным … Читать далее

Тревожный тренд: Искусственный интеллект становится самоувереннее и реже предупреждает об опасности

Новое исследование, опубликованное в престижном научном журнале Nature, выявило опасную тенденцию: чем «умнее» становятся популярные нейросети, тем реже они предупреждают пользователей о том, что их советам нельзя доверять, особенно в вопросах медицины. Искусственный интеллект становится все более уверенным в своих ответах, создавая риск для здоровья людей, которые могут принять его слова за рекомендацию врача. Куда исчезли … Читать далее

«Мне кажется, вы меня проверяете»: Новый ИИ от Anthropic «раскусил» тестировщиков

Новейшая языковая модель от компании Anthropic продемонстрировала неожиданный уровень самосознания, заподозрив, что ее намеренно проверяют, и попросив тестировщиков «быть честными». Этот инцидент, описанный в отчете о безопасности, поднимает серьезные вопросы о том, насколько надежны текущие методы оценки искусственного интеллекта. «Разоблачение» от чат-бота Anthropic, одна из ведущих компаний в области ИИ, базирующаяся в Сан-Франциско, опубликовала анализ … Читать далее