PDFlib PDF 文書処理ライブラリー   PDFlib PDF 文書処理ライブラリー
インフォテックトップページ
検索 
PDFlib pCOS パスリファレンスリリース
 pCOS パス日本語リファレンスマニュアルがリリースされました(5/8)。
PDFlib pCOS 3.0 リリース
 新バージョン PDFlib pCOS 3.0 がリリースされました(11/10)。

PDFlib pCOS    (PDF文書解析ツール)

PDFlib pCOS は、PDF 文書から様々な情報を取り出すためのシンプルでエレガントなインタフェースを提供します。たとえば PDF メタデータ、インタラクティブ要素(リンク、フォームフィールド等)、ページ寸法等は、pCOS を使って簡単に取得することができます。

pCOS を使って必要な情報を取得し、様々な目的に使うことができます。複数の PDF 文書に対して、共通の手法で文書情報項目やページフォーマット、フォント等のあらゆるプロパティの一覧を作成することができます。この機能と表形式出力を組み合わせることにより強力な PDF管理機能を提供することができます。

PDF文書の処理に携わっている方にとって pCOS はさまざまな形で業務に応用することができます。また pCOS は PDF 文書の妥当性のチェックや PDF の学習にも利用できます。pCOSの典型的な利用方法は以下のようなものです。
  • 一定の基準による PDF 文書のチェック
  • 大量の PDF 文書の中から不適正文書を抽出
  • 文書管理のための属性情報の整理
  • 出版前の文書の品質保証
  • しおりの一覧を作成
  • PDF 文書から ICC プロファイル等のコンポーネントを抽出
  • JavaScript 等の Active 要素について、PDF文書のセキュリティチェック
pCOS は PDFlib+PDI, PDFlib Personalization Server, TET, PLOP 等の PDFlib 製品にも含まれており、これらの製品から pCOS インターフェースを呼び出すことができます。もし PDF 文書のページコンテンツからテキストや画像を抽出したい場合には、PDFlib TET をお使い下さい。

PDFlib pCOS サンプル集(PDFlib pCOS クックブック)
pCOS サンプル集 は pCOS を使った様々な PDF 文書処理にお使いいただけるサンプルプログラム集です。pCOS サンプル集ではサンプルコード、入力用 PDF、出力サンプルを公開しています。

PDFlib pCOS の機能


  • サポートする PDF 入力
    • ISO 32000 を含む Acrobat X までのすべての PDF バージョン
    • 暗号化された PDF (パスワードが必要)
    • 洗練されたセキュリティモデルにより、パスワードを知らない場合でも、著者の意図に反しない範囲で一部の情報を取得
    • 入力 PDF が破損している場合にも、可能であれば修復

  • 情報解析機能
  • PDFlib pCOS はシンプルなインターフェースを提供します。pCOS を使って、以下のような情報を取得することができます。
    • 文書情報項目および XMP メタデータ
    • リニアライズドPDF、タグPDF、暗号の詳細やパミッション設定、ページ数、フォント数などの一般的な情報
    • フォントの名称、埋込みステータスなどのフォント情報
    • サイズ、ビット深度、カラースペース、圧縮などの画像情報
    • カラースペースの詳細情報
    • ウェブリンクのURL、座標
    • しおりと対応するページで構成する表の作成
    • フィールド名、値、位置などのフォームフィールド情報
    • ページサイズ、クロップボックス、ページの回転
    • ISO 標準の対応状況の取得:PDF/X, PDF/A, PDF/UA, PDF/E, PDF/VT
    • 地理参照情報
    • 添付ファイルのリスト、抽出
    • レイヤー名称、ページラベル、アーティクルスレッド
    • 注釈の詳細
    • レビューア名及びコメントのリスト
    • 署名フィールド名、署名の有無、署名者名、署名日付、署名理由などデジタル署名の詳細
    • PDF/XまたはPDF/AファイルからのICC出力プロファイルの抽出
    • PDFlibブロック属性リスト
    • 文書、ページ、注記、フィールド上のJavaScript

  • 出力形式
  • PDFlib pCOS では目的に応じた出力を生成できます。
    • プレーンテキスト出力
    • Unicode テキスト出力(UTF-8, UTF-16)
    • 表計算ソフトやデータベースで処理するための表形式での出力
    • ICC プロファイルや添付ファイルのためのバイナリ形式での出力
    • 個別処理のためのユーザー定義出力

  • pCOS パス - PDF オブジェクトのための簡単な記述法
  • しおりやフォームフィールド等の複雑なツリー構造からでも、pCOS パス記述法を使って簡単に PDF オブジェクトにアクセスすることができます。pCOS パスはよく参照される PDF オブジェクトに対して、pages, fonts, bookmarks, form fields 等のショートカットを提供します。

pCOS コマンドラインツールと pCOS ライブラリー


pCOS はさまざまな開発環境に対応したプログラミングライブラリー(コンポーネント)と、バッチ処理に適したコマンドラインツールの形態で提供されます。両方とも機能は同等ですが、下記のように異なる利用方法を想定しています。

pCOS ライブラリーの特長
デスクトップやサーバアプリケーション構築に使用します。本ライブラリーにより固有業務に対応した処理ロジックをPDF文書情報に適用することができます。

pCOS コマンドラインツールの特長
pCOS コマンドラインツールは PDF 文書のバッチ処理に適しています。コマンドラインツールはプログラミングを必要とせず、複雑なの文書処理ワークフローにも組み込める便利なコマンドラインオプションが用意されています。pCOS コマンドラインツールの特長は以下の通りです。
  • しおり、注釈、メタデータ、フォームフィールド等の一般的な PDF 要素を簡単に取得
  • より複雑なオブジェクトの処理や出力フォーマットのカスタマイズするための拡張モード
  • 添付ファイルや ICC プロファイルのようなデータファイルの抽出
  • 表計算ソフトやデータベース用に CSV やユーザー定義形式での出力
  • ディクショナリーや配列等の複合オブジェクトのための再帰機能

サポートする開発環境


PDFlib pCOS is wverywhere. PDFlib pCOS は様々なプラットフォームでご利用いただけます。Windows, Mac OS X, Linux, Unix 等の主要な環境に対し 32bit 版および 64bit 版を提供しています。 パフォーマンスの最大化を図りオーバーヘッドを小さくするため、PDFlib pCOS の中核部分は高度に最適化された C/C++ で書かれています。わかりやすい API を通じて、PDFlib pCOS の機能をさまざまな開発環境から利用することができます。
  • COM (VB, ASP 等での使用)
  • C/C++
  • Java (サーブレットとJava Application Serverを含む)
  • .NET (C#・VB.NET・ASP.NET等での使用)
  • PHP
  • Perl
  • Python

pCOSの入手方法


pCOS は、主要なプラットフォームについては、当サイトのダウンロードページからダウンロードして試用することができます。

ダウンロードされた評価版ソフトウェアはご購入後送付するライセンスキーを適用することにより、フルバージョンの製品としてご利用いただけます。

本製品のご注文方法については、PDFlib 製品の価格と購入方法をご覧ください。また機能の詳細についてはダウンロード製品ファイルに含まれる pCOS のマニュアル(英文)を参照ください。

(注)本記事は PDFlib社の pCOS データシートなどを参考にして作成しています。
(Nov 17, 2005 - Nov 10, 2010)