Агенты в интернете становятся все многочисленней и разнообразней, и под них активно строится своя параллельная инфраструктура, охватывающая базовые интернет-сервисы. Платежными системами, например, вовсю занимаются банки.
Фундаментальная инфраструктура интернета — это, как мы знаем, поиск. И тут за последние недели была парочка интересных анонсов (удивительно, но не от Гугла).
Microsoft анонсировал (пока в виде листа ожидания) сервис Web IQ: пакет AI-native APIs к индексу Бинга, оптимизированный под запросы агентов. Суть сформулирована соблазнительно: Fewer tokens in, better answers out, lower cost per call; и это выглядит разумно: для проверки какой-то информации агенту нет нужды читать всю страницу, умный API отдаст лишь необходимый фрагмент и в итоге агент потратит меньше токенов.
Perplexity изначально строился как поиск ИИ-эры, и у него тоже объявлена новация. В зависимости от задачи, у агентов могут быть совершенно различные и подчас сложные стратегии извлечения информации из интернета, совсем не похожие на человеческие запросы.
we are introducing a new search architecture across our products: Search as Code (SaC). This new architecture empowers models to reach into the search stack itself rather than merely consume its final outputs
Впечатляет, с какой скоростью под новые реалии подстраиваются, казалось бы, уже давно устаканившиеся инфраструктурные сервисы интернета. И немножко завидую агентам: вот бы под нас так оперативно подлаживались… Хорошо быть ИИ-агентом, наверное
https://www.microsoft.com/en-us/webiq
А вот статья от Perplexity:
https://research.perplexity.ai/articles/rethinking-search-as-code-generation