Ученые лаборатории исследований искусственного интеллекта (ИИ) T-Bank AI Research создали метод SAE Match, который позволяет понять, почему модель приняла то или иное решение в процессе вычисления. В перспективе можно будет влиять на ответы ИИ, повышая их точность и качество. Отмечается, что данное исследование особенно важно для качественной работы ИИ в критически важных сферах, например, в медицине, финансовой отрасли и безопасности.
«Наши исследования в области интерпретируемости ИИ направлены на то, чтобы сбои можно было заметить и быстро исправить их без дорогостоящего переобучения модели», – рассказал руководитель научной группы LLM Foundations T-Bank AI Research Никита Балаганский. Он также добавил, что это научное открытие станет первым шагом к созданию более надежного ИИ.