Немного про мой бэкграунд
Я начал программировать еще в школе. Потом поступил на робототехнику и на аутсорсе помогал компании, которая делала проекты для компаний уровня Big Tech вроде Google и Microsoft. Там впервые серьезно погрузился в задачи с искусственным интеллектом и понял, что хочу создавать что-то свое.
Ради работы в международном проекте отчислился из вуза и уехал в Армению. Но всё же чувствовал, что, во-первых, хочу получить системное образование. А во-вторых, попробовать создать свой проект на основе ИИ.
Так я поступил в онлайн-бакалавриат ТюмГУ и Нетологии «Разработка IT-продуктов и информационных систем». Это позволяет мне учиться из другой страны, прокачивать нужные навыки для работы и получить полноценный государственный диплом.
Параллельно вместе со знакомыми разработчиками хотел создать студию, которая разрабатывает решения на базе Retrieval Augmented Generation (RAG) — технологии комбинирования больших языковых моделей с векторными базами знаний.
Почему LegalTech
Чтобы понять ценность продукта, нужно немного углубиться в контекст.
В работе юристов поиск релевантной судебной практики — обязательная и очень трудоемкая часть подготовки к делу. В России не прецедентное право, но практика, особенно Верховного суда, часто задает траекторию решения — юристы прикладывают такие примеры к материалам дела.
Обычно это делается вручную: через справочные правовые системы, базы судов или собственные архивы практики. Это долго, трудоемко и не всегда эффективно: на один запрос могут выпадать тысячи документов, из которых релевантные — единицы.
Случайность сыграла ключевую роль: знакомый юрист, который помогал оформлять документы для нашей студии, указал на эту проблему. И оказалось, что связка RAG и fine-tuning больших языковых моделей идеально ложится на задачу поиска практики. Так студия превратилась в стартап.
Кроме того, на раннем этапе подключился мой преподаватель и ментор из онлайн-бакалавриата Алексей Топчий. Он помог с проработкой концепции и презентацией проекта. Кстати, стартап позволяет мне закрывать некоторые дисциплины на сессии, например по цифровому маркетингу и дизайну.
Как наш ассистент помогает юристам
ExplainLAW собирает юридические документы из открытых источников: сайтов судов, законодательных органов, профильных обзоров. Мы приводим PDF к читаемому виду через OCR и парсеры, индексируем и храним их в векторном виде, чтобы искать по смыслу, а не только по словам. Плюс мы заключили партнерство со справочно-правовой системой «Гарант».
Вместо 1500 одинаково нерелевантных ссылок пользователь получает 3–5 максимально близких к делу материалов, на которые можно опереться в аргументации.
Вызовы и технические трудности
Главная проблема на старте — скорость и точность поиска. Первые версии продукта были медленными и багованными: юристы жаловались, что результаты приходят с задержками и не всегда точные. Мы переписывали архитектуру каждые полгода: меняли алгоритмы, обновляли индексы, ускоряли обработку.
Среди решений, которые реально помогли:
- Анонимайзер документов, чтобы безопасно обрабатывать персональные данные.
- Кеширование результатов для типовых запросов.
- Разделение сценариев: от краткой аналитики до суммаризации договоров — сейчас поддерживаем около 15 сценариев.
- Интеллектуальная оркестрация — система, которая выбирает лучший путь обработки запроса в зависимости от его типа.
Первые версии ExplainLAW мы собирали на Llama 3.4 и столкнулись с классической проблемой галлюцинаций больших языковых моделей. Бот уверенно придумывал несуществующие нормы права, ссылался на отмененные законы и путал термины.
С начала 2023 года в 12 странах было зарегистрировано как минимум 129 дел, в которых юристы использовали поддельные ссылки на несуществующие прецеденты или цитаты — все они были сгенерированы инструментами искусственного интеллекта.
После перехода на GPT-4 качество выросло, но оставались проблемы с юридической терминологией и скоростью поиска.
Мы экспериментировали с векторными базами Chroma и Qdrant и в итоге доработали стандартные пакеты Chroma, чтобы улучшить хранение данных и ускорить поиск судебных решений. Но настоящий прорыв случился только после перехода на GPT-o1 и оптимизации RAG. Модель начала лучше понимать юридический контекст, а поиск судебной практики стал заметно точнее.
По нашим наблюдениям, RAG снижает число галлюцинаций примерно на 80%. Модель опирается только на переданные ей документы и работает с быстро обновляющейся юридической базой.
Во время обучения в онлайн-бакалавриате я усилил навыки в java-разработке. Благодаря этому мы перенесли высоконагруженные микросервисы с Python на более производительный язык. Это сделало сервис стабильнее и ускорило отклик для пользователей.
Команда и управление
Самым сложным было выстроить процессы. На старте я вообще не умел управлять командой.
Здесь сильно помогла учеба: параллельно у нас шел курс по управлению проектами. Я обращался к преподавателю Марине Кирилиной за советами: она показала, как выстраивать прозрачную коммуникацию, как организовать доску в таск-трекере, посоветовала, какие книги читать.
Сейчас мы работаем недельными спринтами по канбану, один-два раза в неделю собираемся на звонках. Это особенно важно, потому что команда распределена по разным городам и странам.
За два года через команду прошло около 20 человек. Не все выдерживали темп стартапа: кто-то терял мотивацию, кто-то уставал от постоянных переделок и отсутствия стабильности. Сейчас ядро — семь человек, которые действительно горят продуктом: разработчики, дизайнер, юрист-методолог. Часть задач выполняет партнерская студия из Уфы.
К чему мы пришли за год
За первый год мы прошли путь от MVP в Телеграме до продукта с собственной веб-версией и обновленным дизайном.
Прошли несколько акселераторов: ИТМО, Академию инноваторов и Южный IT-парк. Менторы на программах помогли перестроить процессы тестирования и сфокусироваться на пользователях. Из материального — выиграли грант крупного провайдера на использование облачной инфраструктуры.
Это очень помогло нам, потому что всё остальное я финансирую из своего кармана, и это тяжело.
Мы растем органически, без бюджета на рекламу, за счет сарафанного радио и профессиональных сообществ, поэтому гордимся результатами:
- 2000 пользователей.
- Около 100 платных подписок.
- 5 B2B-пилотов.
- Партнерство с Гарантом.
А что дальше
В 2026 году хотим технически усилить продукт в трех направлениях:
- Ускорить обработку документов и повысить точность поиска.
- Вывести анонимайзер в отдельный продукт.
- Добавить возможность подключения персональных баз юристов, чтобы ассистент работал не только с нашей векторной базой, но и с их внутренними материалами.
Для корпоративных клиентов готовим on-premise-решения — чтобы ExplainLAW можно было безопасно использовать во внутреннем контуре компании.
С точки зрения стратегии выходим на B2B-сегмент и партнерство с вузами, чтобы студенты-юристы могли тестировать продукт в учебных кейсах.
Как не сойти с пути (и с ума)
За два года я вынес несколько принципов, которые работают в любом стартапе:
Делайте быстро. Если гипотезу нельзя проверить за пару недель — значит, она не приоритет.
Проверяйте на реальных пользователях. Первые отзывы часто болезненны, но именно они показывают слабые места продукта.
Учитесь управлять. Речь про время, процессы и даже людей. Стартап — это вакуум, который вытягивает всё время и внимание, поэтому спасает только календарь, трекеры задач и здоровый тайм-менеджмент.
Поддержка семьи и друзей очень важна, но еще сильнее мотивируют реальные отзывы пользователей и сообщество LegalTech-разработчиков — активные, открытые люди, с которыми всегда можно обсудить идею.
А еще посоветую книги:
- Эрик Рис «Бережливый стартап».
- Роб Фитцпатрик «Спроси маму».
- Дэн Олсен «MVP. Как выводить на рынок товары и услуги».
- Игорь Рызов «Кремлёвская школа переговоров».
- Ицхак Адизес — весь цикл книг об управлении изменениями.
- Евгений Карасюк «Слон на танцполе».
И блоги, куда стоит заглядывать: Disruptors и CDP Moscow.