您現在可以使用
Intl.Segmenter敬上
適用於依語言代碼區分的文字區隔,將字串拆成字詞、語句
圖形或圖形
許多非拉丁語系語言,例如中文和日文
請勿使用空格來分隔字詞。因此,使用 JavaScript split()
將文字分割成字詞的方法,傳回錯誤結果。
使用Intl.Segmenter
Intl.segmenter() 建構函式;
傳入 locale 和 granularity 等選項,這可
值為 "grapheme"、"word" 或 "sentence"。下列
範例會為日文建立新的 Intl.Segmenter 物件,以分割字詞。
const segmenter = new Intl.Segmenter('ja-JP', { granularity: 'word' });
呼叫
segment()敬上
方法為包含文字字串的 Intl.Segmenter 物件方法
會傳回可疊代:
const segments = segmenter.segment(str);
console.table(Array.from(segments));
在 JavaScript 中使用 Intl.Segmenter 的國際文字區隔
還有其他範例,包括如何將 Intl.Segmenter 與表情符號搭配使用。