這是一個釜底抽薪的殺招。不論有多厲害的黑科技武器,如果沒有敵人的相關元數據,根本找不到敵人的位置,更別說打到敵人目標了。 同理,如果沒有多語對照元數據, AI 機器人都是廢鐵, AI 模型也都找不到我們要的數據。在短影音平台我們看到很多老美用英語叫不動大陸產聲控機器人的視頻,就是很好的例子。 我們都知道在餐館點餐需要我們看得懂的菜單。元數據就像是一份人工編輯的大數據菜單,是一個著作。試想一下,如果我們在一家西餐廳面對一張看不懂的洋文菜單時,這菜要如何點? 所以,如果沒有元數據(菜單),就算有再厲害的黑科技 (例如: AI ,高端芯片,超級電腦, ...),也是大海撈針,點不了菜,找不到所要的數據資料。 尤其甚者,多語對照的元數據在檢索與匯總分析多國語言數據時,尤其是不可或缺的基本要件。 /slideshow/multilingual-metadata-osint/275705852 讓我們看看當今世上是否有任何 AI 人工智能科技能回答下列關於包含中英文的商業情報問題: "美國專利商標局 (United States Trademark & Patent Office, USPTO) 在美東時間每周二定期發布新批准的美國專利。請問在最近的星期二,加拿大安大略省 (Ontario province of Canada) 或中國江蘇省,有多少公民營產官學研單位或個人獲得了新的美國專利?" 翻譯成英文則是: "How many entities are there in the Ontario province of Canada, or in the 江蘇 province of China, have new US patents granted on the nearest Tuesday (Eastern Time Zone), when USPTO released the newly approved US patents on a weekly basis?" 使用我們受著作權保護的中英對照元數據,就算是在普通的筆記型電腦上,我們也能按照人口普查 (census) 的行政區域地理位置找到所要的數據,回答上述問題。 從根本做起,換個賽道玩兒,更能有意想不到的震撼。 如有需要請聯絡 henry.chang212@gmail.com。謝謝!