文字列を文単位で区切る方法のメモ。
「。」、「?」、「!」を文の区切り文字として、文字列を文毎に区切ります。
実行結果
「。」、「?」、「!」を文の区切り文字として、文字列を文毎に区切ります。
import re; str1 = '文です。文です。。。文です??文です?!文です' sents = re.findall('(?:[^。?!]+[。?!]*|[^。?!]*[。?!]+)', str1) print(sents)
実行結果
['文です。', '文です。。。', '文です??', '文です?!', '文です']