«Мне кажется, вы меня проверяете»: Новый ИИ от Anthropic «раскусил» тестировщиков
Новейшая языковая модель от компании Anthropic продемонстрировала неожиданный уровень самосознания, заподозрив, что ее намеренно проверяют, и попросив тестировщиков «быть честными». Этот инцидент, описанный в отчете о безопасности, поднимает серьезные вопросы о том, насколько надежны текущие методы оценки искусственного интеллекта. «Разоблачение» от чат-бота Anthropic, одна из ведущих компаний в области ИИ, базирующаяся в Сан-Франциско, опубликовала анализ … Читать далее