大型語言模型在工業領域的潛力 - 1. 工業與聊天機器人 / Industry and ChatbotsYung-Ting Chen
?
我在這份投影片先以工業發展的演進點題,由工業1.0的機械化生產,一路進展到工業5.0強調人機協作、資訊化、個人化、智慧化與永續發展。我點出,隨著工業4.0時代儀表板資料的爆炸性成長,傳統的資料呈現方式已難以滿足需求,因此,具備理解、推理和學習能力的智慧認知助理(Intelligent Cognitive Assistants, ICA)應運而生,而大型語言模型(Large Language Models, LLM)正是其核心技術。
接著,在介紹大型語言模型之前,我先回顧了對話機器人(或稱之為聊天機器人)的發展歷史,從1966年最早的ELIZA,到模擬妄想型精神分裂症的PARRY,再到結合上下文知識的JABBERWACKY,以及採用模式比對的A. L. I. C. E.。接著,我介紹了2001年AOL即時通助手SmarterChild,以及蘋果語音助手SIRI,這些都為後來的對話機器人發展奠定了基礎。最後,我提到2020年由OpenAI推出的ChatGPT,以及2023年世界首款聯合檢索增強型對話機器人SUVA,這些都代表了對話式人工智慧技術的重大突破。
然而,這些對話機器人究竟是如何應用在工業領域,我們會在下一份投影片揭曉。
This presentation took place at COSCUP on July 30, 2023.
Hugging Face can be described as the GitHub for AI models. Initially, it was born to address the difficulty and incompatibility of natural language models. Now, besides open-source AI models for natural language, there are numerous other open-source AI models available on the platform. According to leaked documents from Google, open-source AI models are likely to dominate the development of the entire industry in the future. Therefore, the role of Hugging Face is becoming increasingly important.
This talk is designed for beginners in Chatbot development. It will guide you through using the natural language processing models from Hugging Face and demonstrate step by step how to integrate them into LINE to create a chatbot.
This presentation took place at R ladies Taipei on July 31, 2023.
Hugging Face can be described as the GitHub for AI models. Initially, it was born to address the difficulty and incompatibility of natural language models. Now, besides open-source AI models for natural language, there are numerous other open-source AI models available on the platform. According to leaked documents from Google, open-source AI models are likely to dominate the development of the entire industry in the future. Therefore, the role of Hugging Face is becoming increasingly important.
This talk is designed for beginners in Hugging Face. It will guide you through using the natural language processing models from Hugging Face.
The slide for MakeNTU, which offers a short brief of YOCTOL's recent showcases, and YOCTOL's proprietary chatbot framework (Bottender), and natural language understanding engine (Understood).
natural language understanding brief
第一次做簡報就上手 It is easy to make slides for the 1st timeTung-Lin Lee
?
TED和一般簡報有什麼不同?要注意的事有哪些?要很會做Powerpoint嗎?教大家如何做好一個18分鐘的TED簡報。
What is the difference between TED speech and general presentation? What are the points? This slide is to tell you how to make slides like TED speech for the 1st time.
Go 語言 (又稱Golang) 是 Google 推出新一代的強大語言,今年 3 月 Google 公佈了去年底統計的問卷結果,發現 63% 用 Go 來寫網站,38% 用來開發系統程式,35% 用來做 DevOps,本次議題將會帶您瞭解為什麼 Go 語言適合打造微服務架構,Go 語言大給微服務什麼樣的特性以及 Go 語言適合用來開發什麼樣的系統?
This presentation took place at R ladies Taipei on July 31, 2023.
Hugging Face can be described as the GitHub for AI models. Initially, it was born to address the difficulty and incompatibility of natural language models. Now, besides open-source AI models for natural language, there are numerous other open-source AI models available on the platform. According to leaked documents from Google, open-source AI models are likely to dominate the development of the entire industry in the future. Therefore, the role of Hugging Face is becoming increasingly important.
This talk is designed for beginners in Hugging Face. It will guide you through using the natural language processing models from Hugging Face.
The slide for MakeNTU, which offers a short brief of YOCTOL's recent showcases, and YOCTOL's proprietary chatbot framework (Bottender), and natural language understanding engine (Understood).
natural language understanding brief
第一次做簡報就上手 It is easy to make slides for the 1st timeTung-Lin Lee
?
TED和一般簡報有什麼不同?要注意的事有哪些?要很會做Powerpoint嗎?教大家如何做好一個18分鐘的TED簡報。
What is the difference between TED speech and general presentation? What are the points? This slide is to tell you how to make slides like TED speech for the 1st time.
Go 語言 (又稱Golang) 是 Google 推出新一代的強大語言,今年 3 月 Google 公佈了去年底統計的問卷結果,發現 63% 用 Go 來寫網站,38% 用來開發系統程式,35% 用來做 DevOps,本次議題將會帶您瞭解為什麼 Go 語言適合打造微服務架構,Go 語言大給微服務什麼樣的特性以及 Go 語言適合用來開發什麼樣的系統?
這份投影片中主要是介紹3D掃描儀與XR擴增實境裝置,並以此將大家帶領到元宇宙的世界。首先,我會從「立體數位化」開始,展示如何使用 REVOPOINT POP3 這款 3D 全彩掃描器,將實體物件轉換為數位模型。我會實際操作示範,讓大家了解掃描的流程與注意事項,並分享這款掃描器的優缺點。
接著,我會進入「XR延展實境」的領域,介紹 Meta Quest 3 這款熱門的擴增實境設備。除了操作展示,也會說明它如何切換 VR、AR 和 XR 模式,以及其成熟的互動介面。我會帶領大家體驗如何利用 Meta Quest 3 檢視 AR 模型,並分享相關的操作技巧。
兩個設備介紹完成後,接著在體驗環節就讓大家親手操作 3D 掃描器,掃描自己的小物,並使用 Meta Quest 3 體驗延展實境的樂趣。
最後,我以「深耕元宇宙」作為結語,分享一些關於元宇宙的應用案例,例如如何利用立體展間設計、生成式 AI 建立 3D 模型,以及如何運用網頁技術開發 XR 應用。我強調了數位化與延展實境結合的潛力,例如能夠將武俠文化帶入元宇宙環境的應用,以及如何利用科技來典藏回憶。希望這次演講能讓大家了解數位化與延展實境的最新技術與應用,並啟發大家在元宇宙中探索更多可能性。
在這份投影片中,我先介紹命名實體識別(Named Entity Recognition, NER)的基本概念,說明其定義、應用領域以及所面臨的挑戰,例如同名、歧義以及多字複合詞等問題。接著,我列舉了常見的命名實體類型,如人名、組織、地點、日期時間等,並展示了 NER 在新聞內容分類、人物關係圖建構以及閱讀輔助等方面的應用。
在工具方面,我介紹了多種 NER 工具,包括僅支援英文的 Stanford NER 和 Illinois Named Entity Recognizer,以及支援多國語言的 GATE 和 spaCy。特別針對中文處理,我著重介紹了中研院 CKIP Lab 的相關資源,包括 CKIP NER 以及 CKIP Transformers 工具,並透過實例說明其如何辨識文字中的命名實體,並標註其類別。
實作部分,我帶領大家進行了兩個實作練習。實作 2-1 著重於新聞文本的命名實體分析,讓大家熟悉 NER 的基本流程,從設定文本列表、準備 NER 工具,到執行 NER 分析並儲存結果。實作 2-2 則進一步挑戰從檔案讀取文本進行 NER 分析,並鼓勵大家思考長詞優先的做法可能帶來的問題。
最後,我還為進階學習者準備了額外挑戰,包括探索 CKIP NER 的辨識極限,以及如何篩選特定類型的 NER 結果。我也同時鼓勵聽眾嘗試使用AI 工具輔助程式碼的撰寫,讓大家的想象力能夠盡情發揮。
我在這份投影片中,主要探討在教學情境下,關於繪圖需求的相關議題,並聚焦於AI繪圖的應用與限制。首先,我點出了大家在尋找教材圖片時常遇到的著作權爭議,以及AI繪圖看似能解決問題,但實際上卻可能產生新的法律與道德挑戰。
我深入解析了生成式AI的著作權問題,強調AI本身並非著作權人,使用AI繪圖並不等同於擁有著作財產權。同時,我也提醒大家務必留意各AI繪圖服務的授權條款,像是DALL-E、Stable Diffusion和Midjourney等,它們在商業使用上的規範各有不同。
接著,我進一步探討了AI繪圖作為教材的適當性。我指出,AI繪圖可能因為難以傳遞正確資訊、錯誤引導閱讀焦點,以及無法精準呈現教學所需的圖形等問題,而不適合直接作為教材使用。我認為,教材的視覺呈現應該以清晰、準確為優先,而非過度花俏或不符教學目標。
在尋求合適的教材圖片時,我介紹了創用CC授權條款(Creative Commons Licenses)以及CC0公眾領域貢獻宣告的概念,鼓勵大家使用這些開放授權的素材。我也分享了許多實用的開放素材庫,像是圖示類的flaticon、icon ninja,剪貼畫類的Pixabay、PublicDomainVectors,以及圖片類的CC0免費圖庫搜尋引擎、Pxhere等。此外,我也介紹了國內外的數位典藏與資料庫,例如臺灣記憶、故宮Open Data,以及JSTOR、Library of Congress Digital Collections等,提供更多元的圖片來源。
最後,我坦言理想與現實之間仍存在差距,即使有這麼多資源,有時還是難以找到完全符合需求的圖片。因此,我將在下一部分探討如何「以AI繪圖圖片」,來解決這個問題。
現代研究需要現代手段:用知識管理和AI輕鬆做研究! Part 2 - 南藝大 - 2024.pdfYung-Ting Chen
?
在閱讀部分,我特別強調了「目的性閱讀」的重要性。許多人以為論文需要逐字逐句地從頭讀到尾,但實際上,帶著問題跳讀關鍵部分才能快速掌握精髓。我介紹了 SciSpace、Semantic Scholar 和 NotebookLM 等工具,這些工具能生成文獻摘要、標記重點,甚至讓我們用自然語言直接詢問內容。我也分享了一些可能的挑戰,例如 AI 回答可能不夠精確,提醒大家在使用時要保留批判性。
在寫作部分,我以自己的經驗為例,展示如何用心智圖來規劃論文架構,並透過 ChatGPT 等大型語言模型進行內容生成與修改。我還提供了一些技巧,例如建立專有詞彙表和草擬提問筆記本,以提升 AI 在寫作過程中的準確性與實用性。我也試用了 ChatGPT with Canvas,它的視覺化編輯功能讓文本修改更加直觀,但使用時也要注意可能發生的名詞誤改問題。
最後,我探討了使用生成式 AI 的學術倫理。我認為,研究者應該坦誠揭露 AI 的應用,讓讀者了解研究成果的來源與過程。在我看來,AI 是一雙能讓我們飛得更高的翅膀,但它無法取代我們的思考與判斷。用 AI 輔助研究確實能夠提升效率,而且學習新技術所帶來的成長感也讓人覺得十分充實,但我也提醒自己與大家,要慢下來檢查內容,不要盲從AI給出的建議,仔細確認研究的正確性才是紮實完成研究的康莊大道。
45. 參考資料 (1/2)
45
● Colabianchi, S., Bernabei, M., & Costantino, F. (2022). Chatbot for
training and assisting operators in inspecting containers in seaports.
Transportation Research Procedia, 64, 6–13.
https://doi.org/10.1016/j.trpro.2022.09.002
● Sai, B., Thanigaivelu, S., N, S., C S, S. B., & A, R. (2022). Integration of
Chatbots in the Procurement Stage of a Supply Chain. 2022 6th
International Conference on Computation System and Information
Technology for Sustainable Solutions (CSITSS), 1–5.
https://doi.org/10.1109/CSITSS57437.2022.10026367
● Sun, F., Zhan, Z., Guo, H., Zhang, M., & Tang, J. (2023). GraphVF:
Controllable Protein-Speci?c 3D Molecule Generation with Variational
Flow (No. arXiv:2304.12825). arXiv.
https://doi.org/10.48550/arXiv.2304.12825
● Hsu, Y.-C., Yang, Z., & Buehler, M. J. (2022). Generative design,
manufacturing, and molecular modeling of 3D architected materials
based on natural language input. APL Materials, 10(4), 041107.
https://doi.org/10.1063/5.0082338
46. 參考資料 (2/2)
46
● Stella, F., Della Santina, C., & Hughes, J. (2023). How can LLMs
transform the robotic design process? Nature Machine Intelligence,
5(6), 561–564. https://doi.org/10.1038/s42256-023-00669-7
● Makatura, L., Foshey, M., Wang, B., H?hnlein, F., Ma, P., Deng, B.,
Tjandrasuwita, M., Spielberg, A., Owens, C., Chen, P. Y., Zhao, A., Zhu, A.,
Norton, W., Gu, E., Jacob, J., Li, Y., Schulz, A., & Matusik, W. (2024). How
Can Large Language Models Help Humans in Design and
Manufacturing? Part 1: Elements of the LLM-Enabled Computational
Design and Manufacturing Pipeline. Harvard Data Science Review,
Special Issue 5. https://doi.org/10.1162/99608f92.cc80fe30
● Boiko, D. A., MacKnight, R., Kline, B., & Gomes, G. (2023). Autonomous
chemical research with large language models. Nature, 624(7992),
570–578. https://doi.org/10.1038/s41586-023-06792-0
● Garcia, C. I., DiBattista, M. A., Letelier, T. A., Halloran, H. D., & Camelio,
J. A. (2024). Framework for LLM applications in manufacturing.
Manufacturing Letters, 41, 253–263.
https://doi.org/10.1016/j.mfglet.2024.09.030