← Назад к ленте Открыть источник ↗

Datalab открыла исходный код Lift — 9B-модели для извлечения структурированных данных из документов.

Datalab открыла исходный код Lift — 9B-модели для извлечения структурированных данных из документов.

По заявлению разработчиков, модель показывает 90,2% точности на их бенчмарке против 91,3% у Gemini 3.5 Flash и заметно опережает специализированные опенсорс решения вроде NuExtract3 (81,5%).

Lift умеет извлекать данные по JSON Schema, а медианное время обработки составляет 9,5 секунды.

Для запуска достаточно: pip install lift-pdf

Модель и код доступны в открытом доступе. 👍

Telegram Видео не загружается заранее Откроется только по нажатию

Ещё из канала

Все посты канала
Веб-скрейпинг уже не будет прежним. 💀 3 часа назад Codex умеет передавать сессии между локальными и удалёнными хостами. 19 часов назад 🔥VPS + ISPmanager со скидкой до 100% на Waicore 20 часов назад Теория мёртвого интернета на практике: энтузиаст с Reddit поднял приватный сервер World of Warcraft на AzerothCore, заселил его 1800 ботами и прикрутил DeepSeek 23 часа назад Если вы часто используете потоковый режим Codex или автоматизированные задачи, стоит учитывать один неприятный момент: это может заметно ускорять износ SSD. 1 день назад Находка: лёгкий локальный векторный поиск, с которым можно быстро собрать собственную базу знаний. 1 день назад

Ещё по теме

Вот и думайте denissexy Экспорт MediaTech-продукта — это всегда комбинация трех вещей: продукта, рынка и правильных контактов Product Radar — лучшие стартапы России

Совет: в ленте включайте только непрочитанное — так вы не смешиваете уже просмотренное с новыми постами.

Общение и предложения