← Назад к ленте Открыть источник ↗
vibecoding tg 10 300 RUB

Находка: лёгкий локальный векторный поиск, с которым можно быстро собрать собственную базу знаний.

Находка: лёгкий локальный векторный поиск, с которым можно быстро собрать собственную базу знаний.

Опенсорс проект zvec от Alibaba уже набрал 10,3 тыс. звёзд на GitHub и активно используется внутри Alibaba в крупных продакшен-сценариях.

Обычно для векторного поиска приходится поднимать отдельный сервис: Pinecone, Weaviate, Qdrant или что-то ещё. Плюсом идут - настройка, инфраструктура и деплой. Для небольших проектов это часто оказывается слишком хардкорно

С zvec всё проще. Он встраивает всю векторную базу данных прямо в ваш процесс - примерно так же, как SQLite работает с реляционными базами данных. Установили через pip, создали коллекцию несколькими строками кода, загрузили данные - и можно выполнять поиск по сходству. Никаких серверов, конфигурационных файлов и доп.инфраструктуры, всё хранится в одном локальном файле.

zvec умеет искать среди сотен миллионов векторов за миллисекунды и поддерживает гибридный поиск: векторный + полнотекстовый. Работает на ноутбуках, серверах и даже на edge-устройствах.

Обновление v0.5.0 от 12 июня заметно расширило возможности проекта:

↳ Нативный полнотекстовый поиск без внешних поисковых движков
↳ Гибридный поиск, объединяющий векторы, ключевые слова и фильтры в одном запросе
↳ Новый дисковый индекс, существенно снижающий потребление памяти на больших объёмах данных
↳ Zvec Studio — визуальный инструмент для просмотра данных и отладки без написания кода

100% опенсорс 😁

Ещё из канала

Все посты канала
Веб-скрейпинг уже не будет прежним. 💀 3 часа назад Codex умеет передавать сессии между локальными и удалёнными хостами. 19 часов назад 🔥VPS + ISPmanager со скидкой до 100% на Waicore 20 часов назад Теория мёртвого интернета на практике: энтузиаст с Reddit поднял приватный сервер World of Warcraft на AzerothCore, заселил его 1800 ботами и прикрутил DeepSeek 23 часа назад Если вы часто используете потоковый режим Codex или автоматизированные задачи, стоит учитывать один неприятный момент: это может заметно ускорять износ SSD. 1 день назад Datalab открыла исходный код Lift — 9B-модели для извлечения структурированных данных из документов. 1 день назад

Ещё по теме

Вот и думайте denissexy Экспорт MediaTech-продукта — это всегда комбинация трех вещей: продукта, рынка и правильных контактов Product Radar — лучшие стартапы России

Совет: в ленте включайте только непрочитанное — так вы не смешиваете уже просмотренное с новыми постами.

Общение и предложения