dataset-creation.ts 12 KB


  1. const translation = {
  2. steps: {
  3. header: {
  4. creation: '지식 생성',
  5. update: '데이터 추가',
  6. },
  7. one: '데이터 소스 선택',
  8. two: '텍스트 전처리 및 클리닝',
  9. three: '실행 및 완료',
  10. },
  11. error: {
  12. unavailable: '이 지식은 사용할 수 없습니다',
  13. },
  14. stepOne: {
  15. filePreview: '파일 미리보기',
  16. pagePreview: '페이지 미리보기',
  17. dataSourceType: {
  18. file: '텍스트 파일에서 가져오기',
  19. notion: 'Notion 동기화',
  20. web: '웹 사이트 동기화',
  21. },
  22. uploader: {
  23. title: '텍스트 파일 업로드',
  24. button: '파일을 끌어다 놓거나',
  25. browse: '찾아보기',
  26. tip: '{{supportTypes}}을(를) 지원합니다. 파일당 최대 크기는 {{size}}MB입니다.',
  27. validation: {
  28. typeError: '지원되지 않는 파일 유형입니다',
  29. size: '파일 크기가 너무 큽니다. 최대 크기는 {{size}}MB입니다',
  30. count: '여러 파일은 지원되지 않습니다',
  31. filesNumber: '일괄 업로드 제한({{filesNumber}}개)에 도달했습니다.',
  32. },
  33. cancel: '취소',
  34. change: '변경',
  35. failed: '업로드에 실패했습니다',
  36. },
  37. notionSyncTitle: 'Notion에 연결되지 않았습니다',
  38. notionSyncTip: 'Notion과 동기화하려면 먼저 Notion에 연결해야 합니다.',
  39. connect: '연결하기',
  40. button: '다음',
  41. emptyDatasetCreation: '비어있는 지식 생성',
  42. modal: {
  43. title: '비어있는 지식 생성',
  44. tip: '비어있는 지식에는 문서가 포함되지 않으며 언제든지 문서를 업로드할 수 있습니다.',
  45. input: '지식 이름',
  46. placeholder: '입력하세요',
  47. nameNotEmpty: '이름은 비워둘 수 없습니다',
  48. nameLengthInvalid: '이름은 1~40자여야 합니다',
  49. cancelButton: '취소',
  50. confirmButton: '생성',
  51. failed: '생성에 실패했습니다',
  52. },
  53. website: {
  54. firecrawlDocLink: 'https://docs.dify.ai/guides/knowledge-base/sync-from-website',
  55. limit: '한계',
  56. options: '옵션',
  57. firecrawlDoc: 'Firecrawl 문서',
  58. selectAll: '모두 선택',
  59. maxDepth: '최대 수심',
  60. includeOnlyPaths: '경로만 포함',
  61. excludePaths: '경로 제외',
  62. preview: '미리 보기',
  63. run: '달리다',
  64. fireCrawlNotConfigured: 'Firecrawl이 구성되지 않았습니다.',
  65. firecrawlTitle: 'Firecrawl로 🔥웹 콘텐츠 추출',
  66. configure: '구성',
  67. resetAll: '모두 재설정',
  68. crawlSubPage: '하위 페이지 크롤링',
  69. exceptionErrorTitle: 'Firecrawl 작업을 실행하는 동안 예외가 발생했습니다.',
  70. scrapTimeInfo: '{{time}}s 내에 총 {{total}} 페이지를 스크랩했습니다.',
  71. unknownError: '알 수 없는 오류',
  72. totalPageScraped: '스크랩한 총 페이지 수:',
  73. fireCrawlNotConfiguredDescription: 'API 키로 Firecrawl을 구성하여 사용합니다.',
  74. extractOnlyMainContent: '기본 콘텐츠만 추출합니다(머리글, 탐색, 바닥글 등 없음).',
  75. maxDepthTooltip: '입력한 URL을 기준으로 크롤링할 최대 수준입니다. 깊이 0은 입력 된 url의 페이지를 긁어 내고, 깊이 1은 url과 enteredURL + one / 이후의 모든 것을 긁어 모으는 식입니다.',
  76. chooseProvider: '제공자 선택',
  77. jinaReaderDocLink: 'https://jina.ai/reader',
  78. useSitemap: '사이트맵 사용',
  79. jinaReaderNotConfiguredDescription: '액세스를 위해 무료 API 키를 입력하여 Jina Reader를 설정합니다.',
  80. jinaReaderDoc: 'Jina Reader에 대해 자세히 알아보기',
  81. jinaReaderTitle: '전체 사이트를 Markdown으로 변환',
  82. jinaReaderNotConfigured: 'Jina Reader가 구성되지 않았습니다.',
  83. useSitemapTooltip: '사이트맵을 따라 사이트를 크롤링합니다. 그렇지 않은 경우 Jina Reader는 페이지 관련성에 따라 반복적으로 크롤링하여 더 적지만 더 높은 품질의 페이지를 생성합니다.',
  84. },
  85. cancel: '취소',
  86. },
  87. stepTwo: {
  88. segmentation: '청크 설정',
  89. auto: '자동',
  90. autoDescription: '청크 및 전처리 규칙을 자동으로 설정합니다. 처음 사용자는 이 옵션을 선택하는 것을 권장합니다.',
  91. custom: '사용자 설정',
  92. customDescription: '청크 규칙, 청크 길이, 전처리 규칙 등을 사용자 정의합니다.',
  93. separator: '세그먼트 식별자',
  94. separatorPlaceholder: '예: 줄바꿈(\\\\n) 또는 특수 구분자(예: "***")',
  95. maxLength: '최대 청크 길이',
  96. overlap: '청크 중첩',
  97. overlapTip: '청크 중첩을 설정하여 그 사이의 의미적 연관성을 유지하고 검색 효과를 향상시킬 수 있습니다. 최대 청크 크기의 10%~25%로 설정하는 것이 좋습니다.',
  98. overlapCheck: '청크 중첩은 최대 청크 길이를 초과할 수 없습니다',
  99. rules: '텍스트 전처리 규칙',
  100. removeExtraSpaces: '연속된 공백, 줄바꿈, 탭을 대체합니다',
  101. removeUrlEmails: '모든 URL과 이메일 주소를 제거합니다',
  102. removeStopwords: '일반적인 불용어(예: "a", "an", "the" 등)를 제거합니다',
  103. preview: '미리보기',
  104. reset: '초기화',
  105. indexMode: '인덱스 모드',
  106. qualified: '고품질',
  107. recommend: '추천',
  108. qualifiedTip: '사용자 쿼리에 대해 더 높은 정확성을 제공하기 위해 기본 시스템 임베딩 인터페이스를 호출하여 처리합니다.',
  109. warning: '모델 제공자의 API 키를 설정하세요.',
  110. click: '설정으로 이동',
  111. economical: '경제적',
  112. economicalTip: '오프라인 벡터 엔진, 키워드 인덱스 등을 사용하여 토큰 소비 없이 정확도를 낮춥니다.',
  113. QATitle: '질문과 답변 형식으로 세그먼트화',
  114. QATip: '이 옵션을 활성화하면 추가 토큰이 소비됩니다',
  115. QALanguage: '사용 언어',
  116. estimateCost: '예상 비용',
  117. estimateSegment: '예상 청크 수',
  118. segmentCount: '청크',
  119. calculating: '계산 중...',
  120. fileSource: '문서 전처리',
  121. notionSource: '페이지 전처리',
  122. other: '기타',
  123. fileUnit: '파일',
  124. notionUnit: '페이지',
  125. previousStep: '이전 단계',
  126. nextStep: '저장하고 처리',
  127. save: '저장하고 처리',
  128. cancel: '취소',
  129. sideTipTitle: '청크와 전처리가 필요한 이유',
  130. sideTipP1: '텍스트 데이터를 처리할 때 청크와 클리닝은 두 가지 중요한 전처리 단계입니다.',
  131. sideTipP2: '세그멘테이션은 긴 텍스트를 단락으로 분할하여 모델이 이해하기 쉽게 합니다. 이로 인해 모델 결과의 품질과 관련성이 향상됩니다.',
  132. sideTipP3: '클리닝은 불필요한 문자 및 형식을 제거하여 지식을 더 깔끔하고 분석 가능한 것으로 만듭니다.',
  133. sideTipP4: '적절한 청크와 클리닝은 모델의 성능을 향상시키고 정확하고 가치 있는 결과를 제공합니다.',
  134. previewTitle: '미리보기',
  135. previewTitleButton: '미리보기',
  136. previewButton: '질문-답변 형식으로 전환',
  137. previewSwitchTipStart: '현재 청크 미리보기는 텍스트 형식입니다. 질문과 답변 형식 미리보기로 전환하면',
  138. previewSwitchTipEnd: ' 추가 토큰이 소비됩니다',
  139. characters: '문자',
  140. indexSettingTip: '인덱스 방식을 변경하려면,',
  141. retrievalSettingTip: '인덱스 방식을 변경하려면,',
  142. datasetSettingLink: '지식 설정',
  143. webpageUnit: '페이지',
  144. websiteSource: '웹 사이트 전처리',
  145. separatorTip: '구분 기호는 텍스트를 구분하는 데 사용되는 문자입니다. \\n\\n 및 \\n은 단락과 줄을 구분하는 데 일반적으로 사용되는 구분 기호입니다. 쉼표(\\n\\n,\\n)와 함께 사용하면 최대 청크 길이를 초과할 경우 단락이 줄로 분할됩니다. 직접 정의한 특수 구분 기호(예: ***)를 사용할 수도 있습니다.',
  146. maxLengthCheck: '최대 청크 길이는 {{limit}} 미만이어야 합니다.',
  147. childChunkForRetrieval: '검색을 위한 자식 청크',
  148. qaSwitchHighQualityTipContent: '현재 고품질 인덱스 방법만 Q&A 형식 청크를 지원합니다. 고화질 모드로 전환하시겠습니까?',
  149. previewChunkTip: '왼쪽의 \'Preview Chunk\' 버튼을 클릭하여 프리뷰를 로드합니다',
  150. general: '일반',
  151. fullDoc: '전체 문서',
  152. previewChunk: '프리뷰 청크(Preview Chunk)',
  153. parentChunkForContext: '컨텍스트에 대한 Parent-chunk',
  154. parentChildDelimiterTip: '구분 기호는 텍스트를 구분하는 데 사용되는 문자입니다. \\n\\n은 원본 문서를 큰 부모 청크로 분할하는 데 권장됩니다. 직접 정의한 특수 구분 기호를 사용할 수도 있습니다.',
  155. paragraph: '단락',
  156. parentChild: '부모-자식',
  157. useQALanguage: 'Q&A 형식을 사용하는 청크',
  158. highQualityTip: '고품질 모드에서 삽입을 마치면 경제적 모드로 되돌릴 수 없습니다.',
  159. notAvailableForQA: 'Q&A 인덱스에는 사용할 수 없습니다.',
  160. qaSwitchHighQualityTipTitle: 'Q&A 형식에는 고품질 인덱싱 방법이 필요합니다.',
  161. notAvailableForParentChild: '부모-자식 인덱스에는 사용할 수 없습니다.',
  162. previewChunkCount: '{{개수}} 추정된 청크',
  163. parentChildTip: '부모-자식 모드를 사용할 때 자식 청크는 검색에 사용되고 부모 청크는 컨텍스트로 회수에 사용됩니다.',
  164. generalTip: '일반적인 텍스트 청크 모드에서는 검색된 청크와 회수된 청크가 동일합니다.',
  165. fullDocTip: '전체 문서가 상위 청크로 사용되며 직접 검색됩니다. 성능상의 이유로 10000 토큰을 초과하는 텍스트는 자동으로 잘립니다.',
  166. parentChildChunkDelimiterTip: '구분 기호는 텍스트를 구분하는 데 사용되는 문자입니다. \\n 은 부모 청크를 작은 자식 청크로 분할하는 데 권장됩니다. 직접 정의한 특수 구분 기호를 사용할 수도 있습니다.',
  167. switch: '스위치',
  168. paragraphTip: '이 모드는 구분 기호와 최대 청크 길이에 따라 텍스트를 단락으로 분할하며, 분할된 텍스트를 검색을 위한 부모 청크로 사용합니다.',
  169. },
  170. stepThree: {
  171. creationTitle: '🎉 지식이 생성되었습니다',
  172. creationContent: '지식 이름이 자동으로 설정되었지만 언제든지 변경할 수 있습니다',
  173. label: '지식 이름',
  174. additionTitle: '🎉 문서가 업로드되었습니다',
  175. additionP1: '문서가 지식에 업로드되었습니다',
  176. additionP2: '지식의 문서 목록에서 찾을 수 있습니다.',
  177. stop: '처리 중지',
  178. resume: '처리 재개',
  179. navTo: '문서로 이동',
  180. sideTipTitle: '다음 단계는 무엇인가요',
  181. sideTipContent:
  182. '문서 인덱싱이 완료되면 지식을 응용 프로그램 컨텍스트로 통합할 수 있습니다. 프롬프트 오케스트레이션 페이지에서 컨텍스트 설정을 찾을 수 있습니다. 또한 독립된 ChatGPT 인덱스 플러그인으로 출시할 수도 있습니다.',
  183. modelTitle: '임베딩을 중지해도 괜찮습니까?',
  184. modelContent: '나중에 처리를 다시 시작해야 할 경우, 중단한 위치에서 계속합니다.',
  185. modelButtonConfirm: '확인',
  186. modelButtonCancel: '취소',
  187. },
  188. firecrawl: {
  189. getApiKeyLinkText: 'firecrawl.dev 에서 API 키 가져오기',
  190. apiKeyPlaceholder: 'firecrawl.dev 의 API 키',
  191. configFirecrawl: 'Firecrawl 구성 🔥',
  192. },
  193. jinaReader: {
  194. apiKeyPlaceholder: 'jina.ai 의 API 키',
  195. getApiKeyLinkText: 'jina.ai 에서 무료 API 키 받기',
  196. configJinaReader: 'Jina Reader 구성',
  197. },
  198. otherDataSource: {
  199. learnMore: '더 알아보세요',
  200. title: '다른 데이터 소스에 연결하시겠습니까?',
  201. description: '현재 Dify의 기술 자료에는 제한된 데이터 소스만 있습니다. Dify 기술 자료에 데이터 소스를 제공하는 것은 모든 사용자를 위해 플랫폼의 유연성과 기능을 향상시키는 데 도움이 되는 환상적인 방법입니다. 기여 가이드를 통해 쉽게 시작할 수 있습니다. 자세한 내용은 아래 링크를 클릭하십시오.',
  202. },
  203. }
  204. export default translation