dataset-creation.ts 14 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204
  1. const translation = {
  2. steps: {
  3. header: {
  4. creation: 'ナレッジの作成',
  5. update: 'データの追加',
  6. },
  7. one: 'データソース',
  8. two: 'テキスト進行中',
  9. three: '実行と完成',
  10. },
  11. error: {
  12. unavailable: 'このナレッジは利用できません',
  13. },
  14. firecrawl: {
  15. configFirecrawl: '🔥Firecrawlの設定',
  16. apiKeyPlaceholder: 'firecrawl.devからのAPIキー',
  17. getApiKeyLinkText: 'firecrawl.devからAPIキーを取得する',
  18. },
  19. jinaReader: {
  20. getApiKeyLinkText: '無料のAPIキーを jina.ai で取得',
  21. apiKeyPlaceholder: 'jina.ai からの API キー',
  22. configJinaReader: 'Jina Readerの設定',
  23. },
  24. stepOne: {
  25. filePreview: 'ファイルプレビュー',
  26. pagePreview: 'ページプレビュー',
  27. dataSourceType: {
  28. file: 'テキストファイルからインポート',
  29. notion: 'Notionから同期',
  30. web: 'ウェブサイトから同期',
  31. },
  32. uploader: {
  33. title: 'テキストファイルをアップロード',
  34. button: 'ファイルをドラッグ&ドロップするか',
  35. browse: '参照',
  36. tip: '{{supportTypes}}をサポートしています。1つあたりの最大サイズは{{size}}MBです。',
  37. validation: {
  38. typeError: 'サポートされていないファイルタイプです',
  39. size: 'ファイルサイズが大きすぎます。最大サイズは{{size}}MBです',
  40. count: '複数のファイルはサポートされていません',
  41. filesNumber: 'バッチアップロードの制限({{filesNumber}}個)に達しました。',
  42. },
  43. cancel: 'キャンセル',
  44. change: '変更',
  45. failed: 'アップロードに失敗しました',
  46. },
  47. notionSyncTitle: 'Notionが接続されていません',
  48. notionSyncTip: 'Notionと同期するには、まずNotionへの接続が必要です。',
  49. connect: '接続する',
  50. cancel: 'キャンセル',
  51. button: '次へ',
  52. emptyDatasetCreation: '空のナレッジを作成します',
  53. modal: {
  54. title: '空のナレッジを作成',
  55. tip: '空のナレッジにはドキュメントが含まれず、いつでもドキュメントをアップロードできます。',
  56. input: 'ナレッジ名',
  57. placeholder: '入力してください',
  58. nameNotEmpty: '名前は空にできません',
  59. nameLengthInvalid: '名前は1〜40文字である必要があります',
  60. cancelButton: 'キャンセル',
  61. confirmButton: '作成',
  62. failed: '作成に失敗しました',
  63. },
  64. website: {
  65. fireCrawlNotConfigured: 'Firecrawlが設定されていません',
  66. fireCrawlNotConfiguredDescription: 'Firecrawl を使用するには、Firecrawl の API キーを設定してください。',
  67. configure: '設定',
  68. run: '実行',
  69. firecrawlTitle: '🔥Firecrawlを使っでウエブコンテンツを抽出',
  70. firecrawlDoc: 'Firecrawlドキュメント',
  71. firecrawlDocLink: 'https://docs.dify.ai/guides/knowledge-base/sync-from-website',
  72. options: 'オプション',
  73. crawlSubPage: 'サブページをクロールする',
  74. limit: '制限',
  75. maxDepth: '最大深度',
  76. excludePaths: 'パスを除外する',
  77. includeOnlyPaths: 'パスのみを含める',
  78. extractOnlyMainContent: 'メインコンテンツのみを抽出する(ヘッダー、ナビ、フッターなどは抽出しない)',
  79. exceptionErrorTitle: 'Firecrawl ジョブの実行中に例外が発生しました:',
  80. unknownError: '不明なエラー',
  81. totalPageScraped: 'スクレイピングされた総ページ数:',
  82. selectAll: 'すべて選択',
  83. resetAll: 'すべてリセット',
  84. scrapTimeInfo: '{{time}} 秒以内に合計 {{total}} ページをスクレイピングしました',
  85. preview: 'プレビュー',
  86. maxDepthTooltip: '入力されたURLを基にしたクローリング作業での設定可能な最大深度について説明します。深度0は入力されたURL自体のページを対象としたスクレイピングを意味します。深度1では、元のURLの直下にあるページ(URLに続く最初の"/"以降の内容)もスクレイピングの対象になります。この深度は指定した数値まで増加させることができ、それに応じてスクレイピングの範囲も広がっていきます。',
  87. jinaReaderDocLink: 'https://jina.ai/reader',
  88. useSitemap: 'サイトマップを使用する',
  89. jinaReaderNotConfigured: 'Jina Reader が設定されていません',
  90. jinaReaderDoc: 'Jina Readerの詳細',
  91. jinaReaderTitle: 'サイト全体をMarkdownに変換する',
  92. chooseProvider: 'プロバイダーを選択する',
  93. jinaReaderNotConfiguredDescription: '無料のAPIキーを入力してJina Readerを設定します。',
  94. useSitemapTooltip: 'サイトマップに沿ってサイトをクロールします。そうでない場合、Jina Readerはページの関連性に基づいて繰り返しクロールし、ページ数は少なくなりますが、高品質のページが得られます。',
  95. },
  96. },
  97. stepTwo: {
  98. segmentation: 'チャンク設定',
  99. auto: '自動',
  100. autoDescription: 'チャンクと前処理ルールを自動的に設定します。初めてのユーザーはこれを選択することをおすすめします。',
  101. custom: 'カスタム',
  102. customDescription: 'チャンクのルール、チャンクの長さ、前処理ルールなどをカスタマイズします。',
  103. general: '汎用',
  104. generalTip: '汎用テキスト分割モードです。検索とコンテキスト抽出に同じチャンクを使用します。',
  105. parentChild: '親子',
  106. parentChildTip: '親子分割モード(階層分割モード)では、子チャンクを検索に、親チャンクをコンテキスト抽出に使用します。',
  107. parentChunkForContext: 'コンテキスト用親チャンク',
  108. childChunkForRetrieval: '検索用子チャンク',
  109. paragraph: '段落',
  110. paragraphTip: '区切り文字と最大チャンク長に基づいてテキストを段落に分割し、分割されたテキストを検索用の親チャンクとして使用します。',
  111. fullDoc: '全文',
  112. fullDocTip: 'ドキュメント全体を親チャンクとして使用し、直接検索します。パフォーマンス上の理由から、10000トークンを超えるテキストは自動的に切り捨てられます。',
  113. separator: 'チャンク識別子',
  114. separatorPlaceholder: '例えば改行(\\\\n)や特殊なセパレータ(例:「***」)',
  115. maxLength: '最大チャンク長',
  116. overlap: 'チャンクのオーバーラップ',
  117. overlapTip: 'チャンクのオーバーラップを設定することで、それらの間の意味的な関連性を維持し、検索効果を向上させることができます。最大チャンクサイズの10%〜25%を設定することをおすすめします。',
  118. overlapCheck: 'チャンクのオーバーラップは最大チャンク長を超えてはいけません',
  119. rules: 'テキストの前処理ルール',
  120. removeExtraSpaces: '連続するスペース、改行、タブを置換する',
  121. removeUrlEmails: 'すべてのURLとメールアドレスを削除する',
  122. removeStopwords: '「a」「an」「the」などのストップワードを削除する',
  123. preview: 'プレビュー',
  124. previewChunk: 'チュンクをプレビュー',
  125. reset: 'リセット',
  126. indexMode: 'インデックス方法',
  127. qualified: '高品質',
  128. highQualityTip: '高品質モードで埋め込みを終了したら、経済的モードに戻すことはできません。',
  129. recommend: '推奨',
  130. qualifiedTip: '埋め込みモデルを呼び出してドキュメントを処理し、より正確な検索を行うと、LLMが高品質の回答を生成するのに役立ちます。',
  131. warning: 'モデルプロバイダのAPIキーを設定してください。',
  132. click: '設定に移動',
  133. economical: '経済的',
  134. economicalTip: '検索時にチャンクあたり10個のキーワードを使用することで、精度は低下しますが、トークン消費を抑えられます。',
  135. QATitle: '質問と回答形式でセグメント化',
  136. QATip: 'このオプションを有効にすると、追加のトークンが消費されます',
  137. QALanguage: '使用言語',
  138. useQALanguage: 'Q&A形式で分割',
  139. estimateCost: '見積もり',
  140. estimateSegment: '推定チャンク数',
  141. segmentCount: 'チャンク',
  142. calculating: '計算中...',
  143. fileSource: 'ドキュメントの前処理',
  144. notionSource: 'ページの前処理',
  145. websiteSource: 'ウエブサイドの前処理',
  146. other: 'その他',
  147. fileUnit: 'ファイル',
  148. notionUnit: 'ページ',
  149. webpageUnit: ' ページ',
  150. previousStep: '前のステップ',
  151. nextStep: '保存して処理',
  152. save: '保存して処理',
  153. cancel: 'キャンセル',
  154. sideTipTitle: 'なぜチャンクと前処理が必要なのか',
  155. sideTipP1: 'テキストデータを処理する際、チャンクとクリーニングは2つの重要な前処理ステップです。',
  156. sideTipP2: 'セグメンテーションは長いテキストを段落に分割し、モデルがより理解しやすくします。これにより、モデルの結果の品質と関連性が向上します。',
  157. sideTipP3: 'クリーニングは不要な文字や書式を削除し、ナレッジをよりクリーンで解析しやすいものにします。',
  158. sideTipP4: '適切なチャンクとクリーニングはモデルのパフォーマンスを向上させ、より正確で価値のある結果を提供します。',
  159. previewTitle: 'プレビュー',
  160. previewTitleButton: 'プレビュー',
  161. previewButton: 'Q&A形式に切り替える',
  162. previewSwitchTipStart: '現在のチャンクプレビューはテキスト形式です。質問と回答形式のプレビューに切り替えると、',
  163. previewSwitchTipEnd: ' 追加のトークンが消費されます',
  164. characters: '文字',
  165. indexSettingTip: 'インデックス方法を変更するには、',
  166. retrievalSettingTip: '検索方法を変更するには、',
  167. datasetSettingLink: 'ナレッジ設定',
  168. separatorTip: '区切り文字は、テキストを区切るために使用される文字です。\\n\\n と \\n は、段落と行を区切るために一般的に使用される区切り記号です。カンマ (\\n\\n,\\n) と組み合わせると、最大チャンク長を超えると、段落は行で区切られます。自分で定義した特別な区切り文字を使用することもできます(例:***)。',
  169. maxLengthCheck: 'チャンクの最大長は {{limit}} 未満にする必要があります',
  170. previewChunkTip: 'プレビューを読み込むには、左側の \'チュンクをプレビュー\' ボタンをクリックしてください',
  171. previewChunkCount: '推定チャンク数: {{count}}',
  172. switch: '切り替え',
  173. qaSwitchHighQualityTipTitle: 'Q&A形式には高品質なインデックスが必要です',
  174. qaSwitchHighQualityTipContent: '現在、高品質なインデックス作成のみがQ&A形式の分割をサポートしています。高品質モードに切り替えますか?',
  175. notAvailableForParentChild: '親子インデックスでは利用できません',
  176. notAvailableForQA: 'Q&Aインデックスでは利用できません',
  177. parentChildDelimiterTip: '区切り文字とは、テキストを分割するために使用される文字です。\\n\\n は、元のドキュメントを大きな親チャンクに分割する際におすすめです。独自の区切り文字も使用できます。',
  178. parentChildChunkDelimiterTip: '区切り文字とは、テキストを分割するために使用される文字です。\\n は、親チャンクを小さな子チャンクに分割する際におすすめです。独自の区切り文字も使用できます。',
  179. },
  180. stepThree: {
  181. creationTitle: '🎉 ナレッジが作成されました',
  182. creationContent: 'ナレッジの名前は自動的に設定されましたが、いつでも変更できます。',
  183. label: 'ナレッジ名',
  184. additionTitle: '🎉 ドキュメントがアップロードされました',
  185. additionP1: 'ドキュメントはナレッジにアップロードされました',
  186. additionP2: '、ナレッジのドキュメントリストで見つけることができます。',
  187. stop: '処理を停止',
  188. resume: '処理を再開',
  189. navTo: 'ドキュメントに移動',
  190. sideTipTitle: '次は何ですか',
  191. sideTipContent: 'ドキュメントのインデックスが完了したら、ナレッジをアプリケーションのコンテキストとして統合することができます。プロンプトオーケストレーションページでコンテキスト設定を見つけることができます。また、独立したChatGPTインデックスプラグインとしてリリースすることもできます。',
  192. modelTitle: '埋め込みを停止してもよろしいですか?',
  193. modelContent: '後で処理を再開する必要がある場合は、中断した場所から続行します。',
  194. modelButtonConfirm: '確認',
  195. modelButtonCancel: 'キャンセル',
  196. },
  197. otherDataSource: {
  198. title: '他のデータソースと接続しますか?',
  199. description: '現在、Difyのナレッジベースには利用できるデータソースが限られています。Difyのナレッジベースにデータソースを提供いただくことは、プラットフォームの柔軟性と能力を向上させる上で非常に有益です。貢献ガイドをご用意していますので、ぜひご協力ください。詳細については、以下のリンクをクリックしてください。',
  200. learnMore: '詳細はこちら',
  201. },
  202. }
  203. export default translation