Перейти к содержимому
Перейти к содержимому
juntotrip .

Как работает juntotrip

Каждая страница сайта проходит один и тот же пайплайн. Ответы не пишет человек с нуля — они агрегируются, перефразируются и проходят проверку качества.

1. Сбор

Мы собираем сообщения из публичных и invite-only сообществ путешественников (преимущественно Telegram). Только публичные обсуждения; никаких личных сообщений и приватных каналов. Сбор идёт с задержкой 48 часов, чтобы офтоп успели вычистить модераторы чатов.

2. Чистка и анонимизация

Спам, ботовые сообщения и личные идентификаторы удаляются. Мы не храним юзернеймы, номера телефонов и фотографии людей. Внутренние ID хэшируются.

3. AI-классификация и кластеризация

Вопросы классифицируются по теме и городу, затем кластеризуются, когда несколько путешественников спрашивают про одно и то же в 14-дневном окне. Embedding-similarity (cosine) плюс keyword-matching (BM25).

4. Quality gates

Вопрос становится страницей только если у него минимум 5 содержательных ответов, 200+ слов суммарно и хотя бы один конкретный артефакт (название места, ссылка, документ).

5. Редакторский контроль

Редакция ежедневно выборочно проверяет топовые страницы. Мы не пишем ответы, но следим за фактическими ошибками, вредным контентом и тоном. Запросы на удаление обрабатываются в течение 7 дней.