#author("2024-11-26T14:32:10+09:00","default:ogiwiki","ogiwiki") **青空文庫XHTMLファイルをライブラリを使って整形する [#i5eee962] ***パッケージのインストール [#td55405d] -lxml :XMLパーザ(parser)(XMLの構造を解釈してプログラムから利用しやすいようにする) // pip install lxml sudo apt install python3-lxml -Beautiful Soup :HTMLやXMLファイルからデータを抽出・解析する // pip install beautifulsoup4 sudo apt install python3-bs4 //--mecabをpythonから使うモジュール // pip install mecab *** [#mbcb5fdc]