Компания Meta* представила метод Self-Taught Evaluator, позволяющий генеративной модели на основе искусственного интеллекта самостоятельно обучаться без вмешательства человека, сообщается в пресс-релизе компании. "Итак, мы выпустили Self-Taught Evaluator - новый метод генерации синтетических данных предпочтений для модели вознаграждения, не основываясь на комментариях человека", - говорится в сообщении. Моделирование вознаграждения - это подход машинного обучения искусственного интеллекта на основе обратной связи, оценки или подсказки. Из релиза Meta* следует, что новый подход включает в себя процесс выстраивания логических цепочек на основе непрерывной схемы самосовершенствования модели.Кроме того, компания сообщила о выпуске генеративной модели вознаграждения на основе прямой оптимизации предпочтений в инструменте машинного обучения RewardBench, обученной на данных без использования пояснений человека. Компания Facebook* в 2021 году объявила о переименовании в Meta*. Ее создатель Марк Цукерберг заявил, что новый бренд делает акцент на метавселенной, где человек откажется от экранов и будет испытывать эффект присутствия в виртуальной реальности. * Деятельность Meta (соцсети Facebook и Instagram) запрещена в России как экстремистская. |