Новый генеративный ИИ разработанный MIT превосходит всех аналогов

На пике своей популярности, генеративный искусственный интеллект предоставляет обещания о создании мира, где элементарные структуры преображаются в сложные образы — превращая простое распределение в изысканные шаблоны изображений, звука и текста, делая искусственное воспроизведение невероятно реалистичным.На пике своей популярности, генеративный искусственный интеллект предоставляет обещания о создании мира, где элементарные структуры преображаются в сложные образы — превращая простое распределение в изысканные шаблоны изображений, звука и текста, делая искусственное воспроизведение невероятно реалистичным.
Сферы воображения больше не остаются простыми абстракциями, благодаря инновационной модели искусственного интеллекта, разработанной исследователями из Лаборатории компьютерных наук и искусственного интеллекта Массачусетского технологического института (CSAIL). Их новый подход сочетает два физически разнородных, но мощных закона, лежащих в основе современных генеративных моделей: диффузию, объясняющую случайное движение элементов, и поток Пуассона, который базируется на законах электрических зарядов.
PFGM++ способна создавать сложные шаблоны, поражая своей способностью создавать реалистичные изображения и имитировать реальные процессы. Эта модель является усовершенствованием модели PFGM и основывается на математических принципах уравнения «Пуассона». Для улучшения ее эффективности, исследователи добавили новое измерение, аналогичное переходу от 2D-скетча к 3D-модели, что позволило модели более гибко взаимодействовать с данными и создавать новые образцы с разных точек зрения.
PFGM++ берет электрическое поле, созданное в PFGM, и расширяет его до сложной многомерной структуры. Важно, что модель достигает баланса между надежностью и простотой использования, предоставляя новый метод обучения, который позволяет эффективно исследовать электрическое поле. Для поддержания этой теории в будущем исследователи намерены совершенствовать определенные аспекты модели, чтобы адаптировать ее для конкретных задач и задач, таких как генерация текста и изображений в видео.