パーソナルビジネスソフトとお役立ち情報のサイト
PDFlib pCOSの概要

PDFlib pCOS 2.0の新機能

(Oct 30, 2007リリース)

PDFlib pCOS 2.0では以下の機能が強化されています。
  • コマンドラインツールでさまざまなオプションを追加

  • スードオブジェクトを拡張し下記のオブジェクトや属性の取り扱いを追加
    • ビット深度、色属性、圧縮フィルターなどの画像属性
    • 複雑な色空間への簡略化されたアクセスなどを含む色空間
    • グラフィックステータスやパターンなどのページリソース
    • ローマ数字などによるページラベル
    • PDF/X及びPDF/Aのステータス
    • あて先ページを含むアーティクルスレッド(ビーズ)

  • PDFパーサ機能を下記の点で強化
    • AES暗号方式をサポート
    • CCITTFax、RunLengthDecode、DCTDecodeの各圧縮形式をサポート
    • 画像ストリームの フィルター
    • Flate及びLZW圧縮方式の予測関数をサポート
    • 入力PDF文書の修復モード

PDFlib pCOSの機能

PDF文書情報抽出ツール、PDFlib pCOS(PDFlib Comprehensive Object Syntax:以下pCOSと呼ぶ)はPDF文書のメタデータ、ハイパーテキストなどの文書情報を検索、取得するためのソフトウェアツールです。pCOSは実体としてのページコンテンツ以外の全てのオブジェクト情報を統一された記述方法で容易に検索できるため従来必要とされた低位レベルでのプログラミングを行う必要がなくなりました。

pCOSでは下記のようなさまざまなPDF文書の要素について検索・抽出することができます。
  • info情報及びXMPメタデータ
  • リニアライズドPDF、タグPDF、暗号の詳細やパミッション設定、ページ数、フォント数などの一般的な情報
  • フォントの名称、埋込みステータスなどのフォント情報
  • サイズ、ビット深度、カラースペース、圧縮などの画像情報
  • PDFの全カラーに対応するカラースペースの詳細情報
  • ウェブリンクのURL、座標
  • ブックマークと対応するページで構成する表の作成
  • フィールド名、値、位置などのフォームフィールド情報
  • ページサイズ、クロップボックス、ページの回転
  • PDF/X互換ファイルのステータス
  • 添付ファイルのリスト及び抽出
  • レイヤー名称、ページラベル、アーティクルスレッド
  • 注記の詳細
  • レビューア名及びコメントのリスト
  • 署名フィールド名、署名者名、署名日付、署名理由などデジタル署名の詳細
  • PDF/XまたはPDF/AファイルからのICC出力プロファイルの抽出
  • PDFlibブロック属性リスト
  • 文書、ページ、注記、フィールド上のJavaScript

PDFlib pCOSの応用例

PDF文書の処理に携わっている方にとってpCOSはさまざまな形で業務に応用することができます。またpCOSをPDF文書の妥当性のチェックやPDFの学習に利用できます。pCOSの典型的な利用方法は以下のようなものです。
  • 一定の基準によるPDF文書のチェック
  • JavaScriptなどActive要素などについてのPDF文書のセキュリティチェック
  • 出版前の文書の品質保証
  • 大量のPDF文書の中から不適正文書を抽出
  • 文書管理のための属性情報の整理
  • PDFデータ構造の詳細の学習

サポートされるPDF入力

pCOSは主要なPDF文書の入力をサポートします。
  • PDF 1.7(Acrobat 8)までの全てバージョンのPDF文書
  • RC4及びAES暗号化PDF文書(パスワードが必要)
  • 洗練されたセキュリティモデルによりセキュリティに違反しない範囲での文書情報の取得
  • 障害のあるPDF文書を可能であれば修復

出力形式

pCOSは以下の形式での出力が可能です。
  • プレーンテキスト出力
  • 表計算ソフトやデータベースによる処理のための表形式での出力
  • ICCプロファイルや添付ファイルなどをそのままバイナリー出力
  • UTF-8またはUTF16形式でのユニコードテキスト出力
  • 個別の後処理のためのユーザ定義出力
pCOSコマンドラインツールでは容易に複数の文書の基本情報やページ、フォントなどの属性情報を抽出することができ、この機能と表形式出力を組み合わせることにより強力なPDF管理機能を提供することができます。

pCOSコマンドラインツールとpCOSライブラリー

pCOSはさまざまな開発環境に対応したプログラミングライブラリー(コンポーネント)及びバッチ処理に適したコマンドラインツールの形態で提供されます。両方とも全てのpCOSパスシンタックスをサポートしますが、下記のように異なる利用方法を想定しています。
  • pCOSコマンドラインツールはPDF文書のバッチ処理に適しています。コマンドラインツールはプログラミングを必要とせず、任意の文書処理ワークフローに組み込める便利なコマンドラインオプションが用意されています。主要機能についてはショートカットが使用できます。
  • pCOSプログラミングライブラリーはデスクトップやサーバアプリケーション構築に使用します。本ライブラリーにより固有業務に対応した処理ロジックをPDF文書情報に適用することができます。

pCOSライブラリーの特徴

pCOSライブラリーの特徴は以下の通りです。
  • C、C++、COM、.NET及びJavaの言語バインディング
  • メモリーからの文書直接読み込み(C言語のみ)
  • プログラミングサンプルの提供

pCOSコマンドラインツールの特徴

pCOSコマンドラインツールの特徴は以下の通りです。
  • ブックマーク、注記、メタデータ、フォームフィールドなどPDF基本要素の検索
  • より複雑なオブジェクトの検索や出力形式のカスタマイズ
  • 添付ファイルやICCプロファイルの抽出などデータの抽出
  • 表計算ソフトやデータベース処理のためのカンマ区分形式ファイルや表形式ファイル出力
  • ディクショナリーやアレイなどのコンポジットオブジェクトの出力機能

pCOSパス:PDFオブジェクト処理のための簡単な記述法

pCOSはPDF文書中の任意のオブジェクトを指定するための簡単なパス記述法をサポートしています。pCOS記述法はPDFオブジェクトの構造に忠実な記述法を用意する一方で、ページ、フォント、ブックマーク、フォームフィールドなどのアクセス頻度の高いオブジェクトについては、オブジェクト構造の階層をたどる手間を省いてスード(仮想)オブジェクトとして直接参照できる方法を用意しています。pCOSパスの記述法についてはマニュアルに詳細に記述されています。

pCOSパス記述法は、ライブラリー、コマンドラインツールの両方でサポートされています。

プログラミングとパフォーマンス

pCOSは、ポータビリティー、パフォーマンスと堅牢性を考慮し開発されました。pCOSは、マルチスレッドサーバーアプリケーションの展開に対しスレッドセーフとなっています。コア・ライブラリは、最大のパフォーマンスと最小のオーバーヘッドを実現するために高度に最適化されたCコードで開発されています。追加言語バインディングとして、COM、C、C++、Java、および.NETが用意されています。

pCOSの入手方法

pCOSは、主要なプラットフォームについては、当サイトのダウンロードページからダウンロードして試用することができます。

ダウンロードされた評価版ソフトウェアはご購入後送付するライセンスキーを適用することにより、フルバージョンの製品としてご利用いただけます。

本製品のご注文方法については、PDFlib製品の価格と購入方法をご覧ください。また機能の詳細についてはダウンロード製品ファイルに含まれるpCOSのマニュアル(英文)を参照ください。


(注)本記事はPDFlib社のpCOSデータシートなどを参考にして作成しています。
(Nov 17, 2005 - Oct 30, 2007)