PDFlib TET サンプル集(クックブック)
テキストの抽出
テキスト抽出
|
シンプルなテキスト抽出 |
単語リスト
|
文書から全てのユニークな単語を抽出してソートされたリストを作成します |
索引
|
TET で、文書から全ての単語を抽出して索引を作成します。索引はアルファベット順でソートされ、単語が出現するページ番号を一覧表示します。 |
グリフ情報の抽出
|
TET で、文書からグリフ情報を抽出します。 |
注釈からテキストを抽出
|
TET と pCOS インターフェースで文書にある注釈からテキストを抽出します。 |
フォントの処理
フォントの検索
|
特定のフォントが PDF 文書の何処に使われているかを明示します。ページ番号、位置、最初に見つかったテキストの最初の部分を表示します。 |
フォントの分析
|
TET で、文書に含まれるフォント毎の情報を表示するサンプルプログラムです。 |
(May 6, 2010 - Oct 16, 2019)