Разработка MVP: LLM base document search
Важно:
1. реализовать функционал до-обучения на базе обратной связи
2. необходим поиск с учетом полного контекста запроса (не по ключевым словам). Но и в лоб сравнивать embedding тоже не надо
3. документы длиной 20-30 тыс токенов
Стек:
OS: Ubuntu
DB: Векторная, на усмотрение разработчика
Python + torch + transformers / hugging face
Fast API
+ любой UI (web) для демонстрации