Googleから、Webで使われているテキストのエンコーディング割合がOfficial Google Blog: Unicode nearing 50% of the webにおいて発表された。1年半前の発表時点の傾向が続いており、ほかのエンコーディングを引き離してUnicode (UTF-8)が50%のシェアへ近づいている。変化割合 ...
下田 正弘(東京大学大学院人文社会系研究科 インド哲学仏教学專門分野 教授/次世代人文学開発センター人文情報学部門長) 2021年2月25日に公表されたTEIガイドライン(Text Encoding Initiative Guidelines)P5 version 4.2.0において、日本語のルビがガイドラインの基本 ...
この連載で説明しているサンプルでは、テキストの抽出はPDFViewControllerクラスで行っていた。これを拡張していこう。 前にも説明したが、PDFデータはストリームとして与えられる。テキストとエンコーディングがどのような関係でストリームに登場するか見 ...
本記事では、パソコン作業で遭遇する文字化けについて解説。Webサイト、メール、Officeアプリで発生する文字化けの原因を理解し、各場面での具体的な直し方を覚えておこう。 目次 文字化けとは なぜ文字化けするのか 文字コードとは Webサイトでの ...
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する