Google Colab: PDF to CSV 変換器を Colab に設置 [第二話 死闘篇] – NaN は dtype: float で捕捉!

Google Colab の Python を使って PDFをCSVに変換(PDF to CSV)し、容易にデータ再利用するためのスクリプトを紹介するシリーズ。第二話 死闘篇では、「PDF のデータ化を阻む Excel の『セル内改行』」、「どうしても match できない NaN」、「見えない敵『RF+LF』改行」といった伏兵たちが登場。さて、どうやって退治するか?(普通に Excel でやった方が早くないですか?🙄という意見は聞こえないタイプ)