格式
關鍵主題
條列點
序言
第1章 概論
內容與平台篇
第2章 分類與數據描述標準
分類法
Metadata Schema
第3章 可擴展置標語言XML
XML
DTD
XSL
XPath
XLink
第4章 海量多媒體數據管理系統
海量多媒體數據管理系統的組成
多媒體對象服務器
索引服務器
提供檢索
索引類型
順序索引
散列索引
句柄系統 Handle System
分布式數字對象服務框架
數字對象
句柄 Handle
CNRI
<Handle> ::= <Handle Naming Authority> "/" <Handle Local Name>
數字對象集
倉儲
三層式架構
倉儲外殼
RAP協議
格式轉換
權限與版權管理
永久倉儲
對象管理層
特性
海量數據的調度與分發
單一訪問入口
多個Mirror Site
第5章 高層協議中中間件體系結構
中間件技術
在Client/Server中加入第三層
在複雜的後端服務與相對覺簡單的前端應用之間承上啟下
技術分類
基於遠程過程調用(RPC)
面向消息的中間件(MOM)
分布式事務處理(TP)監視器
對象請求代理(ORB)
數據庫中間層
最泛用
數字圖書館 高層協議中間件
讓分散數字圖書館能夠統一的標準協議
原則
標準規模合宜
兼容性:協議
擴展性:新技術、新協議、新平台
Warwick框架
對整個元數據空間的模組化表示
可以將不同元數據集合聚集在一起
類型
簡單類型
包含著元數據的嵌入式包
間接引用
可能透過類似URL的引用
容器
非常通用,新的聚合狀態
可以被另一個容器所包容
Warwick 框架目錄 WFC
高層信息檢索管理
高層付費機制
類型
服務層
圖書館
付費策略層
封裝不同付費機制,讓介面單一化
付費機制層
來自不同付費:VISA, DigiCash
數據質量保證
確保資料的正確性
保證
通訊安全:SSL, HTTPS
信任管理
第6章 交互介面與內容表現
編碼
媒體
寫得挺完整的,可以拿來參考
人機介面
新型人機介面技術
三維輸入
手寫識別、語音識別與自然語言理解
多通道人機介面
讓人同時使用多種交互方式,提高互動自然性
虛擬實現技術
特徵 3i
沉浸 immersion
交互 interaction
構想 imagination
第7章 內容檢索與個性化服務
基本技術
關鍵詞檢索
全文檢索
全文掃描
邏輯組合
元數據檢索
檢索結果評分(相關)
質量與性能評估
網路環境下的資訊內容檢索
特徵
分布式
多用戶
大量數據
非專業
數據調度與導航
數據集成
大型門戶系統支持技術
資料探勘與檢索
文本自動分類
文本自動聚類
自動文摘
「減法」策略
刪掉不重要的句子
加權因素
句子中關鍵語詞出現的分佈狀況
句子在文本結構中的位置狀況
標題
開頭、結尾
句子與引導性語詞的關聯狀況
所以
綜上所述
總而言之
語義重組
尚未成熟
文本綜合
多文本總結主題與內容概括
問答式知識檢索系統
類型
基於關鍵詞匹配
基於句型模版匹配
基於句法與語義分析
個性化主動服務
用戶建模
目的
識別用戶
信念
目標
計畫
用戶模型 stereotypes
洋蔥模型:一層一層包裹
萵苣類型:只知道自己相關的資料
多核萵苣類型:存在多個公共子集
有向圖:擴展多核模型
分類:主動與被動、隱式與顯式
與特定領域知識的關係
用戶參與程度
獲取信息的方法
評價標準
粒度
每一個用戶一個模型
一些用戶共享一個模型
修改能力
時效性
模型數量
第8章 圖像與視頻數據檢索
圖像檢索
基於文本查詢方式
而不是對圖片本身
瀏覽方式
大量圖片效率低
基於實例的查詢方式
徒手草圖查詢方式
視評檢索
結構化分析
鏡頭
切變 cut
場景
關鍵楨 keyframe
故事單元
基於MPEG為多
視評內容快速瀏覽
故事版 storyboard
按照時間順序
選取keyframe
場景轉移圖
避免重複場景出現
層次樹方式
將鏡頭、場景、單元依層次條列
海報集方式
選取可表達基本故事情結的視評海報集
視評摘要方式
特徵抽取
低級語義特徵
顏色
紋理
形狀
鏡頭的有關特徵
場景或故事單元特徵
高級語義特徵
文字
人臉
伴音
第9章 多媒體數據壓縮與傳輸
介紹圖片、視訊、音樂、文本的壓縮方式
不是很重要
第10章 內容錄入與採編
編目步驟介紹
一般流程
編寫腳本及素材的收集整理
素材的編輯
定義元數據的格式
資源內容再製作
純圖像方式
目錄文本
全文本方式
全文索引方式
資源內容標引
XML
就是著錄Metadata
質量檢查
歸檔
元數據抽取
中文OCR
過程:紙質介質--(掃描)-->數字圖檔--(OCR)-->數字文本
漢王OCR新世紀專業版處理步驟
圖像輸入
預處理
版面分析
字符分割與識別
後處理
校對
版面輸出
第11章 數字水印與版權保護
信息偽裝 steganography
概念
信息偽裝
第三方不知道被隱藏的數據的存在
信息隱藏主要應用於相互信任的點對點的祕密通道
對於魯棒性不要求:宿主數據被破壞或失真後,嵌入的信息無法提取出來
數字水印
對魯棒性的要求
Kerkhoffs規則
即使知道水印存在與原理
但不知道密碼
就不能攻破
信息隱藏
介於信息偽裝與數字水印之間
嵌入的數據是公開的,但是沒必要包含它
數字指紋或標誌
特定應用領域
標示版權信息和原創者的序列號
用於產品跟蹤和監視
可見水印
類似物理水印
數字水印特徵
可證明性
不可感知性
視覺上不可感知
統計方法不能恢復
統計方法是指經過編輯處理
魯棒性
一個數字水印應該能夠承受大量的、不同的物理和幾何失真
包含有意的(如惡意攻擊)或無意的(如圖像壓縮、濾波、掃描與複印、噪音污染、尺寸變化等等)
若攻擊者試圖刪除水印,將會導致多媒體產品的徹底破壞
圖像
加密:W = F(I,W,K)
I : 數字圖像
W : 水印信號
K : 密碼
F : 加密函數
水印提取與證明
第一類錯誤:檢測到水印,但實際上不存在
第二類錯誤,沒有檢測到水印,但水印實際存在
水印算法
不需要原始圖像檢測水印
需要原始圖像檢測水印
輸入、輸出分類
私有水印系統
公開水印系統
擴展譜通信 spread spectrum communication
視頻
提出的方法既有簡單的算法,也有新一代算法。
複雜的水印算法通常具有較高的魯棒性
大多對未壓縮的視頻數據進行操作
可嵌入的水印數據速率從每秒百比特到幾比特不等
音頻
echo coding
利用多層遞減回波
在音頻訊號倒譜的某個位置嵌入一個峰值
phase coding
利用音頻信號的相位信息
文本
魯棒性與攻擊行為
技術
圖像壓縮
濾波
低通濾波
圖像量化與圖像增強
幾何失真
攻擊方法
簡單攻擊
同步攻擊
迷惑攻擊
刪除攻擊
第12章 WWW瀏覽器與機器翻譯
多語言檢索
機器翻譯理論
機器翻譯, MT
形式化模型
MT模型I:直接模型
MT模型II:理解模型
源語言分析
詞法分析
句法分析
轉換步驟
句子內部表示
功能結構
格結構
謂詞變元結構
映射
中間語言
翻譯轉換
詞彙轉換
句法轉換
目標語生成
詞法生成
句法生成
風格考慮
超出句子範圍的生成
翻譯知識庫
機器辭典
文法
語料庫
語義網路
世界概念模型
其他技術
基於實例的翻譯
基於統計的翻譯
翻譯記憶技術
網際網路語機器翻譯
翻譯瀏覽器
當做plugin使用
翻譯服務器
即時網頁翻譯
輸入文本翻譯
電子郵件翻譯
多語交談
跨語言信息檢索 CLIR
cross-language information retrieval, CLIR
多向機器翻譯
摘要
檢索
第13章 海量數據的儲存與檢索
第三級儲存器
特徵
容量大
價格低
類型
光盤
磁帶
機器手儲器庫
robotic storage library, RSL
第三級儲器系統
硬體構建
主儲存器
第二級儲器:硬盤
第三級存儲器:機器手
I/O 調度方法
實際上就搜尋演算法
0-維調度法
READ
FCFS
SORT
1-維調度法
SCAN
2-維調度法
OPT算法
SLTF
Weave
LOSS
MPScan
分布
索引
數據操作
查詢儲裡
TPO, two phase optimizer
優化器 -> 調度器
檢索與播放
Play-from-TS
直接從第三級儲存器播放視頻
存入主緩衝區
交替播放方法
分成兩部分
直接從第三級儲存器上播放
交給二級儲存器播放
基於重新分布是評數據的交替播放法
第14章 數字圖書館中的高性能信息處理平台
高性能計算環境
計算網格
組成
網格節點
數據庫
貴重儀器與設備
可視化設備
網格軟件
應用
一般應用
私人使用
網格應用
公開API
信息網格
知識網格
應用篇
第15章 數字圖書館與遠程教育
主要是在講網路遠程教育
第16章 數字圖書館建設探索
從傳統圖書館走入數位圖書館,並作比較
第17章 數字圖書館與電子商務
未來信息社會中的作用
網路社會的信息基礎設施之一
網路應用系統的基礎數據庫
多媒體
圖書館群體
格式標準
網路運行
高新技術
服務
網路社區活動中心之一
國家數字文化平台
國家數字教育平台
國家數字資源中心
帶動信息產業技術發展的基礎性工程
涵蓋與管理多個巨大數字式資料庫的系統
文化事業的重要組成部分
中華民族走向繁榮昌盛的重要標誌之一
佔領網路上中文信息資源陣地
知識經濟的載體和催化劑
科教興國的泉源
提高全民素質、實現終身教育的大學校
國家信息基礎設施(NII)建設的重要內容
公益性與營利性的平衡
直接經濟效益
為了建設數位圖書館,國家投資大筆經費
間接經濟效益
帶動相關產業
平衡
公益性
要與傳統圖書館一致
營利性
對已有信息的再加工收取費用
透過網站吸引注意力進行運作
電子商務
模式
B-B模式
網上金融
網上飛數字商品銷售
網路拍賣
網路軟服務
網路硬服務
空間租用
網站托管
電子商務外包服務
數字商品提供
技術創新
內容服務
網路門戶
虛擬社群
數字圖書館的特點
分散式儲存、集中式管理
智能化管理、更新和探勘 -> 創造與更新
更好的人機教互借面
提供種類齊全的增殖性服務
可行模式探討
門戶網站模式
網上書店模式
知識租貸模式
客戶願意為兩種訊息付費
能賺錢的商業訊息
體育訊息
技術創新模式
免費訊息服務
記錄行為分析與廣告賺錢