PDFからテキストを抽出するのはなぜ難しいのか?