freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)字媒體技術(shù)概論--12媒體傳輸與管理-展示頁

2025-03-14 21:27本頁面
  

【正文】 ? Email: 430PB 即時消息 : 274TB ? ?來自 “ How much information 2023” ? 比較: ? 常用磁盤 : 80500GB 常用盤陣: ? 文件系統(tǒng): 432TB 數(shù)據(jù)中心: 40100TB ? 已實際安裝的分布式文件系統(tǒng): 10100TB 32 為什么關(guān)注搜索引擎 ? 間接原因:信息爆炸 ? 搜索引擎把 海量信息有序地組織起來,提供方便的檢索手段 ? 允許人們找到需要的信息 ? 終極原因:搜索引擎的重要性 ? 控制了搜索引擎就控制了互聯(lián)網(wǎng) 33 為什么關(guān)注搜索引擎 ? 終極原因:搜索引擎的重要性 ? Google: $159B ? Intel: $119B Yahoo: $38B ? Microsoft: $262B Walmart: $199B ? 百度: $ ? 新浪: $ 搜狐: $ ? 聯(lián)想: $ ? 來源: , 34 為什么關(guān)注搜索引擎 ? 搜索引擎現(xiàn)狀 ? 網(wǎng)頁搜索: Google占有壟斷地位 ? 日搜索量 ? Google: 90M, MSN: 28M ? Yahoo: 60M, AOL: 16M, Ask: 13M, 其它: 6M ? ?來源: , ? 多媒體搜索:技術(shù)尚不成熟 ? Google Image ? Youtube ? Flickr 35 為什么關(guān)注搜索引擎 ? 發(fā)展策略 ? 日本的發(fā)展策略 ? 網(wǎng)頁搜索:美國已經(jīng)領(lǐng)先,放棄 ? 多媒體搜索:尚可一爭,大力支持 ? 我們的發(fā)展策略 ? 比美國做得更好! ? 現(xiàn)有搜索引擎仍然不完美 ? 人才,市場 36 搜索引擎結(jié)構(gòu) ? 最終目標:方便用戶獲取需要的信息 信息 1. 獲取 /存儲 2. 理解 3. 索引 4. 輸入 5. 顯示 37 搜索引擎技術(shù) ? 數(shù)據(jù)獲取與存儲 ? 數(shù)據(jù)獲?。?Spider, Crawler, Robot ? 如何并行下載? ? 哪些數(shù)據(jù)是新的,哪些是已有的? ? 新增加的頁面 ? 部分更新的頁面 ? 論壇、 blog ? 現(xiàn)有搜索引擎 ? 未見公開報道使用何種技術(shù) ? 主要是工程性問題 38 搜索引擎技術(shù) ? 數(shù)據(jù)獲取與存儲 ? 數(shù)據(jù)存儲 ? 一致性:大規(guī)模并行訪問不破壞數(shù)據(jù) ? 可靠性:硬件損壞不丟失數(shù)據(jù) ? 擴展性:總體性能與硬件成線性關(guān)系 ? 分布式文件系統(tǒng) ? Google: GFS ? Lustre 39 搜索引擎技術(shù) ? 理解 ? 提取數(shù)據(jù)的語義 ? 數(shù)學(xué)上如何表示語義? ? 如何把數(shù)據(jù)從原始形式轉(zhuǎn)換成所需要的形式? ? 矢量模型 ? 文字串切分成詞 ? 每個詞作為一維,詞的出現(xiàn)頻率作為度量標準 ? 機器學(xué)習(xí)技術(shù) ? 提取文檔的特征并進行分類 40 搜索引擎技術(shù) ? 索引 ? 找到與某個語義相關(guān)的文檔 ? 倒排文件 ? 快速找到 ? B樹, Hash表 ? 更快 ? 并行查找,限時合并 41 搜索引擎技術(shù) ? 輸入 ? 獲取用戶的需求 ? 關(guān)鍵字檢索 ? 分類瀏覽 ? 顯示 ? 組織相關(guān)信息輸出給用戶 ? 相關(guān)項列表 ? 重要性排序: PageRank ? 摘要 42 搜索引擎技術(shù) ? 尚存在的問題 ? 輸入:關(guān)鍵字檢索并不方便 ? 假設(shè) 1:用戶很清楚自己需要什么 ? 可能例外:新聞檢索,多媒體檢索 ? 假設(shè) 2:用戶有能力把需求轉(zhuǎn)換成合適的關(guān)鍵字 ? 大多數(shù)用戶做得并不好 ? 某些需求難以表示成文字,特別是多媒體檢索中 ? 假設(shè) 3:系統(tǒng)有能力把文檔轉(zhuǎn)換成合適的關(guān)鍵字 ? 多媒體文檔:世界難題 ? 文本文檔:關(guān)鍵字也不一定是合適的語義 43 搜索引擎技術(shù) ? 尚存在的問題 ? 理解:計算機并不真正理解文檔的內(nèi)容 ? 多媒體文檔 ? 只能理解很小一部分語義 ? 文本文檔 ? 去除垃圾內(nèi)容 (廣告、目錄等 ) ? 提取結(jié)構(gòu)化信息 ? 信息之間的關(guān)聯(lián) 44 搜索引擎技術(shù) ? 尚存在的問題 ? 顯示 ? 綜合信息提取與表示 ? 海量信息表示 ? 直觀方便瀏覽 ? …… ? 我們?nèi)匀挥袡C會! 45 媒體 分析與檢索 ?基于 內(nèi)容的媒體分析與檢索 (CBR) ? 特征提?。禾崛》从硤D像 /視頻 /音頻內(nèi)容的顏色、紋理等視覺特征和音頻特征; ? 語義提?。禾崛》从硤D像 /視頻
點擊復(fù)制文檔內(nèi)容
教學(xué)教案相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1