dataset-creation.ts 19 KB


  1. const translation = {
  2. steps: {
  3. header: {
  4. creation: 'Создать базу знаний',
  5. update: 'Добавить данные',
  6. },
  7. one: 'Выберите источник данных',
  8. two: 'Предварительная обработка и очистка текста',
  9. three: 'Выполнить и завершить',
  10. },
  11. error: {
  12. unavailable: 'Эта база знаний недоступна',
  13. },
  14. firecrawl: {
  15. configFirecrawl: 'Настроить 🔥Firecrawl',
  16. apiKeyPlaceholder: 'Ключ API с firecrawl.dev',
  17. getApiKeyLinkText: 'Получите свой ключ API с firecrawl.dev',
  18. },
  19. stepOne: {
  20. filePreview: 'Предварительный просмотр файла',
  21. pagePreview: 'Предварительный просмотр страницы',
  22. dataSourceType: {
  23. file: 'Импортировать из файла',
  24. notion: 'Синхронизировать из Notion',
  25. web: 'Синхронизировать с веб-сайта',
  26. },
  27. uploader: {
  28. title: 'Загрузить файл',
  29. button: 'Перетащите файл или',
  30. browse: 'Обзор',
  31. tip: 'Поддерживаются {{supportTypes}}. Максимум {{size}} МБ каждый.',
  32. validation: {
  33. typeError: 'Тип файла не поддерживается',
  34. size: 'Файл слишком большой. Максимум {{size}} МБ',
  35. count: 'Несколько файлов не поддерживаются',
  36. filesNumber: 'Вы достигли лимита пакетной загрузки {{filesNumber}} файлов.',
  37. },
  38. cancel: 'Отмена',
  39. change: 'Изменить',
  40. failed: 'Ошибка загрузки',
  41. },
  42. notionSyncTitle: 'Notion не подключен',
  43. notionSyncTip: 'Чтобы синхронизировать данные из Notion, сначала необходимо установить соединение с Notion.',
  44. connect: 'Перейти к подключению',
  45. button: 'Далее',
  46. emptyDatasetCreation: 'Я хочу создать пустую базу знаний',
  47. modal: {
  48. title: 'Создать пустую базу знаний',
  49. tip: 'Пустая база знаний не будет содержать документов, и вы можете загружать документы в любое время.',
  50. input: 'Название базы знаний',
  51. placeholder: 'Пожалуйста, введите',
  52. nameNotEmpty: 'Название не может быть пустым',
  53. nameLengthInvalid: 'Название должно быть от 1 до 40 символов',
  54. cancelButton: 'Отмена',
  55. confirmButton: 'Создать',
  56. failed: 'Ошибка создания',
  57. },
  58. website: {
  59. fireCrawlNotConfigured: 'Firecrawl не настроен',
  60. fireCrawlNotConfiguredDescription: 'Настройте Firecrawl с API-ключом.',
  61. configure: 'Настроить',
  62. run: 'Запустить',
  63. firecrawlTitle: 'Извлечь веб-контент с помощью 🔥Firecrawl',
  64. firecrawlDoc: 'Документация Firecrawl',
  65. firecrawlDocLink: 'https://docs.dify.ai/guides/knowledge-base/sync-from-website',
  66. options: 'Опции',
  67. crawlSubPage: 'Сканировать подстраницы',
  68. limit: 'Лимит',
  69. maxDepth: 'Максимальная глубина',
  70. excludePaths: 'Исключить пути',
  71. includeOnlyPaths: 'Включить только пути',
  72. extractOnlyMainContent: 'Извлекать только основной контент (без заголовков, навигации, футеров и т. д.)',
  73. exceptionErrorTitle: 'Произошло исключение при запуске задания Firecrawl:',
  74. unknownError: 'Неизвестная ошибка',
  75. totalPageScraped: 'Всего просканировано страниц:',
  76. selectAll: 'Выбрать все',
  77. resetAll: 'Сбросить все',
  78. scrapTimeInfo: 'Всего просканировано {{total}} страниц за {{time}} секунд',
  79. preview: 'Предварительный просмотр',
  80. maxDepthTooltip: 'Максимальная глубина сканирования относительно введенного URL. Глубина 0 сканирует только страницу введенного URL, глубина 1 сканирует URL и все, что находится после введенного URL + один /, и так далее.',
  81. jinaReaderNotConfiguredDescription: 'Настройте Jina Reader, введя свой бесплатный ключ API для доступа.',
  82. jinaReaderDocLink: 'https://jina.ai/reader',
  83. useSitemap: 'Использовать карту сайта',
  84. chooseProvider: 'Выберите провайдера',
  85. jinaReaderNotConfigured: 'Jina Reader не настроен',
  86. jinaReaderDoc: 'Узнайте больше о Jina Reader',
  87. jinaReaderTitle: 'Конвертируйте весь сайт в Markdown',
  88. useSitemapTooltip: 'Следуйте карте сайта, чтобы просканировать сайт. Если нет, Jina Reader будет сканировать итеративно в зависимости от релевантности страницы, выдавая меньшее количество страниц, но более высокого качества.',
  89. },
  90. cancel: 'Отмена',
  91. },
  92. stepTwo: {
  93. segmentation: 'Настройки фрагментации',
  94. auto: 'Автоматически',
  95. autoDescription: 'Автоматически устанавливать правила фрагментации и предварительной обработки. Пользователям, не знакомым с системой, рекомендуется выбрать этот вариант.',
  96. custom: 'Пользовательский',
  97. customDescription: 'Настроить правила фрагментации, длину фрагментов, правила предварительной обработки и т. д.',
  98. separator: 'Идентификатор сегмента',
  99. separatorPlaceholder: 'Например, новая строка (\\\\n) или специальный разделитель (например, "***")',
  100. maxLength: 'Максимальная длина фрагмента',
  101. overlap: 'Перекрытие фрагментов',
  102. overlapTip: 'Установка перекрытия фрагментов может сохранить семантическую связь между ними, улучшая эффект поиска. Рекомендуется установить 10%-25% от максимального размера фрагмента.',
  103. overlapCheck: 'перекрытие фрагментов не должно превышать максимальную длину фрагмента',
  104. rules: 'Правила предварительной обработки текста',
  105. removeExtraSpaces: 'Заменить последовательные пробелы, новые строки и табуляции',
  106. removeUrlEmails: 'Удалить все URL-адреса и адреса электронной почты',
  107. removeStopwords: 'Удалить стоп-слова, такие как "a", "an", "the"',
  108. preview: 'Подтвердить и просмотреть',
  109. reset: 'Сбросить',
  110. indexMode: 'Режим индексации',
  111. qualified: 'Высокое качество',
  112. recommend: 'Рекомендуется',
  113. qualifiedTip: 'Вызов интерфейса встраивания системы по умолчанию для обработки, чтобы обеспечить более высокую точность при запросах пользователей.',
  114. warning: 'Пожалуйста, сначала настройте ключ API поставщика модели.',
  115. click: 'Перейти к настройкам',
  116. economical: 'Экономичный',
  117. economicalTip: 'Используйте автономные векторные движки, индексы ключевых слов и т. д., чтобы снизить точность, не тратя токены',
  118. QATitle: 'Сегментация в формате вопрос-ответ',
  119. QATip: 'Включение этой опции приведет к потреблению большего количества токенов',
  120. QALanguage: 'Сегментировать с помощью',
  121. estimateCost: 'Оценка',
  122. estimateSegment: 'Оценочное количество фрагментов',
  123. segmentCount: 'фрагментов',
  124. calculating: 'Вычисление...',
  125. fileSource: 'Предварительная обработка документов',
  126. notionSource: 'Предварительная обработка страниц',
  127. websiteSource: 'Предварительная обработка веб-сайта',
  128. other: 'и другие ',
  129. fileUnit: ' файлов',
  130. notionUnit: ' страниц',
  131. webpageUnit: ' страниц',
  132. previousStep: 'Предыдущий шаг',
  133. nextStep: 'Сохранить и обработать',
  134. save: 'Сохранить и обработать',
  135. cancel: 'Отмена',
  136. sideTipTitle: 'Зачем нужна фрагментация и предварительная обработка?',
  137. sideTipP1: 'При обработке текстовых данных фрагментация и очистка являются двумя важными этапами предварительной обработки.',
  138. sideTipP2: 'Сегментация разбивает длинный текст на абзацы, чтобы модели могли лучше его понимать. Это улучшает качество и релевантность результатов модели.',
  139. sideTipP3: 'Очистка удаляет ненужные символы и форматы, делая знания более чистыми и легкими для анализа.',
  140. sideTipP4: 'Правильная фрагментация и очистка улучшают производительность модели, обеспечивая более точные и ценные результаты.',
  141. previewTitle: 'Предварительный просмотр',
  142. previewTitleButton: 'Предварительный просмотр',
  143. previewButton: 'Переключение в формат вопрос-ответ',
  144. previewSwitchTipStart: 'Текущий предварительный просмотр фрагмента находится в текстовом формате, переключение на предварительный просмотр в формате вопрос-ответ',
  145. previewSwitchTipEnd: ' потребляет дополнительные токены',
  146. characters: 'символов',
  147. indexSettingTip: 'Чтобы изменить метод индексации, пожалуйста, перейдите в ',
  148. retrievalSettingTip: 'Чтобы изменить метод индексации, пожалуйста, перейдите в ',
  149. datasetSettingLink: 'настройки базы знаний.',
  150. separatorTip: 'Разделитель — это символ, используемый для разделения текста. \\n\\n и \\n — это часто используемые разделители для разделения абзацев и строк. В сочетании с запятыми (\\n\\n,\\n) абзацы будут сегментированы по строкам, если максимальная длина блока превышает их. Вы также можете использовать специальные разделители, определенные вами (например, ***).',
  151. maxLengthCheck: 'Максимальная длина блока должна быть меньше {{limit}}',
  152. switch: 'Выключатель',
  153. parentChunkForContext: 'Родительский блок для контекста',
  154. previewChunkTip: 'Нажмите кнопку «Предварительный просмотр фрагмента» слева, чтобы загрузить предварительный просмотр',
  155. notAvailableForParentChild: 'Недоступно для индекса типа "родитель-потомок"',
  156. parentChildChunkDelimiterTip: 'Разделитель — это символ, используемый для разделения текста. \\n рекомендуется для разбиения родительских блоков на небольшие дочерние блоки. Вы также можете использовать специальные разделители, определенные самостоятельно.',
  157. previewChunk: 'Предварительный просмотр фрагмента',
  158. previewChunkCount: '{{Количество}} Предполагаемые куски',
  159. generalTip: 'Общий режим фрагментации текста, извлекаемые и вызываемые фрагменты одинаковы.',
  160. general: 'Общее',
  161. useQALanguage: 'Фрагмент с использованием формата Q&A в',
  162. notAvailableForQA: 'Недоступно для индекса Q&A',
  163. paragraph: 'Параграф',
  164. parentChild: 'Родитель-дочерний',
  165. fullDoc: 'Полный документальный фильм',
  166. qaSwitchHighQualityTipTitle: 'Формат вопросов и ответов требует высококачественного метода индексации',
  167. parentChildDelimiterTip: 'Разделитель — это символ, используемый для разделения текста. \\n\\n рекомендуется для разделения исходного документа на большие родительские части. Вы также можете использовать специальные разделители, определенные самостоятельно.',
  168. parentChildTip: 'При использовании режима «родитель-потомок» дочерний блок используется для извлечения, а родительский блок — для вызова в качестве контекста.',
  169. paragraphTip: 'В этом режиме текст разбивается на абзацы на основе разделителей и максимальной длины блока, используя разделенный текст в качестве родительского блока для извлечения.',
  170. highQualityTip: 'После завершения встраивания в режиме «Высокое качество» возврат к экономичному режиму невозможен.',
  171. childChunkForRetrieval: 'Детский фрагмент для извлечения',
  172. qaSwitchHighQualityTipContent: 'В настоящее время только высококачественный метод индекса поддерживает фрагментацию формата Q&A. Хотели бы вы перейти в режим высокого качества?',
  173. fullDocTip: 'Весь документ используется в качестве родительского блока и извлекается напрямую. Обратите внимание, что по причинам производительности текст, превышающий 10000 токенов, будет автоматически обрезан.',
  174. },
  175. stepThree: {
  176. creationTitle: '🎉 База знаний создана',
  177. creationContent: 'Мы автоматически назвали базу знаний, вы можете изменить ее в любое время',
  178. label: 'Название базы знаний',
  179. additionTitle: '🎉 Документ загружен',
  180. additionP1: 'Документ был загружен в базу знаний',
  181. additionP2: ', вы можете найти его в списке документов базы знаний.',
  182. stop: 'Остановить обработку',
  183. resume: 'Возобновить обработку',
  184. navTo: 'Перейти к документу',
  185. sideTipTitle: 'Что дальше',
  186. sideTipContent: 'После завершения индексации документа база знаний может быть интегрирована в приложение в качестве контекста, вы можете найти настройку контекста на странице prompt orchestration. Вы также можете создать-workflow приложение как отдельный как независимый плагин.',
  187. modelTitle: 'Вы уверены, что хотите остановить встраивание?',
  188. modelContent: 'Если вам нужно будет возобновить обработку позже, вы продолжите с того места, где остановились.',
  189. modelButtonConfirm: 'Подтвердить',
  190. modelButtonCancel: 'Отмена',
  191. },
  192. jinaReader: {
  193. getApiKeyLinkText: 'Получите бесплатный ключ API в jina.ai',
  194. configJinaReader: 'Настройка Jina Reader',
  195. apiKeyPlaceholder: 'Ключ API от jina.ai',
  196. },
  197. otherDataSource: {
  198. learnMore: 'Подробнее',
  199. title: 'Подключаться к другим источникам данных?',
  200. description: 'В настоящее время база знаний Dify имеет лишь ограниченные источники данных. Добавление источника данных в базу знаний Dify — это отличный способ повысить гибкость и возможности платформы для всех пользователей. Наше руководство по вкладу поможет вам легко начать работу. Пожалуйста, нажмите на ссылку ниже, чтобы узнать больше.',
  201. },
  202. }
  203. export default translation