검색엔진에 적용된 ChatGPTTae Young LeeChatGPT is a natural language processing technology developed by OpenAI. This model is based on the GPT-3 architecture and can be applied to various language tasks by training on large-scale datasets. When applied to a search engine, ChatGPT enables the implementation of an AI-based conversational system that understands user questions or queries and provides relevant information.
ChatGPT takes user questions as input and generates appropriate responses based on them. Since this model considers the context of previous conversations, it can provide more natural dialogue. Moreover, ChatGPT has been trained on diverse information from the internet, allowing it to provide practical and accurate answers to user questions.
When applying ChatGPT to a search engine, the system searches for relevant information based on the user's search query and uses ChatGPT to generate answers to present along with the search results. To do this, the search engine provides an interface that connects with ChatGPT, allowing the user's questions to be passed to the model and the answers generated by the model to be presented alongside the search results.
LLM 모델 기반 서비스 실전 가이드Tae Young LeeReal-time seminar presentation material at the MODU-POP event on September 19, 2023 as ChatGPT Prompt Learning Research Lab Director at MODU's Lab
AI 시대를 준비하는 개발자를 위한 안내서(부제: AI 시대에는 개발자가 필요없다며?)동수 장* AI에서 ChatGPT까지
- AI, ML, Deep Learning, LLM
- LLM의 장점 vs 단점
- LLM이 잘 하는 일 vs 잘 못하는 일
- ChatGPT & GitHub Copilot
- 주요 AI 서비스
* AI와 함께 개발하기
- 개발자의 역량
- 프롬프트 엔지니어링
- AI 시대에 대처하는 우리의 자세
* Demo
* Q&A
Chat GPT_중학생 강의.pptxChiwooSong1중학생 대상에 적합한 Chat GPT 강의 입니다.
1. 인공지능의 기본 개념과 발전 과정 이해하기
2. Large Language Model과 Transformer 모델의 원리와 구조 파악하기
3. ChatGPT의 작동 원리와 다양한 활용 사례 알아보기
AI 비지니스 무엇을 어떻게 준비하고 해야 하는가? - 정우진 (AWS 사업개발 담당)Amazon Web Services Korea최근 글로벌 혁신의 트렌드인 AI의 다양한 사례를 살펴보고 단계적으로 어떻게 접근하고 준비해야 할지를 알려드립니다. 이미지/비디오 인식 등 AI 어플리케이션의 유형과 트렌드를 전달드립니다. 특히 AWS AI 서비스를 성공적으로 도입하고 활용하기 위한 전략을 살펴보고 사례를 통한 Use Case를 통해 단계별 접근 전략을 소개드립니다. 이번 세미나를 통해 최신 AI트렌드와 정의, 그리고 사례 기반의 도입 유형, 접근 전략과 방법론 등을 알 수 있습니다.
더 많은 AWS 온라인 세미나 알아보기: https://aws.amazon.com/ko/events/webinars/series
스타트업은 데이터를 어떻게 바라봐야 할까? (개정판)Yongho Ha우리 회사는 데이터를 볼 필요가 있을까?
봐야 한다면 어떻게 해야 할까?
스타트업이든, 큰 기업이든
데이터가 왜 필요하며, 어떤 기법들로 분석해 나갈 수 있는지 설명합니다.
퍼널, A/B 테스트, 코호트 분석등에 대해 쉽게 설명합니다.
데이터 분석에 필요한 기본 개념: 지표, Funnel 등 데이터를 이해하기 위한 멘탈 모델(Mental Model)Minwoo Kim- 강의록 전문 읽기: http://bit.ly/2KKtzRA
데이터 분석(데이터 사이언스 말고, 통상적으로 스타트업에서 '데이터 분석'이나 '그로스'에 쓰는 데이터 분석)을 공부하려면, 어떤 기본 개념을 가지고 계시면 좋을지에 대해 만들어 본 강의 자료입니다.
카우앤독에서 지인 위주로 꾸린 강의에서 꽤 좋은 평가를 받았으나, 강의안 준비가 너무 힘들어서 실제 유료 강의로 이어지지는 않은 비운의 슬라이드...
멘탈 모델이란 무엇인지, 지표는 무엇이며 퍼널(Funnel)은 무엇인지, 등등의 이야기를 합니다. 기승전 결론은 SQL 배우세요. (https://brunch.co.kr/@minu-log/4)
Little Big Data #1. 바닥부터 시작하는 데이터 인프라Seongyun ByeonThis document discusses using BigQuery and Dataflow for ETL processes. It explains loading raw data from databases into BigQuery, transforming the data with Dataflow, and writing the results. It also mentions pricing of $5 per terabyte for BigQuery storage and notes that Dataflow provides virtual CPUs and RAM. Finally, it includes a link about performing ETL from relational databases to BigQuery.
여기컨_스타트업 기획자의 월화수목금_이수지TechFeministgroup이수지님은 17년 8월 오픈하여 3개월 만에 facebook 50만 좋아요와 누적 100만 사용자, 누적 100만 다운로드, 120만 AU를 달성한 타로챗봇 라마마와 친구들, 헬로우봇(http://hellobot.co/)의 기획자 겸 대표입니다.
#여기컨18 에서는 "스타트업 기획자의 월화수목금"이라는 제목으로 헬로우봇 리서치부터 출시, 운영까지 시기별 기획자의 한 주를 공유해주셨습니다.
BigQuery의 모든 것(기획자, 마케터, 신입 데이터 분석가를 위한) 입문편Seongyun ByeonThe document contains log data from user activities on a platform. There are three columns - user_id, event, and event_date. It logs the activities of 5 users over several days, including events like logins, posts, comments, views. It also includes some aggregated data on unique events and totals by user.
Bigquery와 airflow를 이용한 데이터 분석 시스템 구축 v1 나무기술(주) 최유석 20170912Yooseok Choi9월 12일 구글 클라우드 데이 @ 판교 에서 구글 빅쿼리와 아파치 에어플로우를 이용한 데이터 분석 시스템 구축이라는 주제로 발표한 자료입니다.
오늘 밤부터 쓰는 google analytics (구글 애널리틱스, GA) Yongho Hahttp://ga.yonghosee.com 에서 진행하는 구글 어날리틱스(google analytics) 에 대한 강의 슬라이드 입니다. 이 슬라이드는 샘플이지만, 초반부는 실재 강의 교재 그대로 입니다. 이것 자체로도 여러분이 GA를 이해하는데 좀 도움이 된다면 기쁘겠습니다^^ 감사합니다.
디지털 트윈 기술과 활용 사례 - 공간정보를 중심으로 SANGHEE SHINLX공간정보 아카데미의 '공간정보 기반의 스마트시티 비즈니스 모델 개발' 과정에서 강의한 자료입니다. 디지털 트윈의 개념, 연원, 도시/국토관리로의 확장, 공간정보 분야의 동향과 전망, 디지털 트윈 기반 스마트시티, 오픈소스 기반 디지털트윈 플랫폼인 mago3D, 그리고 mago3D를 적용한 대표적인 사례 등에 대해 소개하였습니다.
A future that integrates LLMs and LAMs (Symposium)Tae Young LeePresentation material from the IT graduate school joint event
- Korea University Graduate School of Computer Information and Communication
- Sogang University Graduate School of Information and Communication
- Sungkyunkwan University Graduate School of Information and Communication
- Yonsei University Graduate School of Engineering
- Hanyang University Graduate School of Artificial Intelligence Convergence
Python과 Tensorflow를 활용한 AI Chatbot 개발 및 실무 적용Susang Kim도입
AI Chatbot 소개
Chatbot Ecosystem
Closed vs Open Domain
Rule Based vs AI
Chat IF Flow and Story Slot
AI기반의 학습을 위한 Data 구성 방법
Data를 구하는 법 / Train을 위한 Word Representation
Data의 구성 / Data Augmentation(Intent, NER)
자연어처리 위한 AI 적용 방안
Intent (Char-CNN) / QnA (Seq2Seq)
Named Entity Recognition (Bi-LSTM CRF) / Ontology (Graph DB)
Chatbot Service를 위한 Architecture 구성
Chatbot Architecture
NLP Architecture
Web Service Architecture
Bot builder / Chatbot API
Test Codes for Chatbot
실무에서 발생하는 문제와 해결 Tips
Ensemble and voting / Trigger / Synonym(N-Gram)
Tone Generator / Parallel processing / Response Speed
마무리
[설명 코드]
Text Augmentation / Slot Bot / QA Bot / Graph DB / Response Generator
AI 비지니스 무엇을 어떻게 준비하고 해야 하는가? - 정우진 (AWS 사업개발 담당)Amazon Web Services Korea최근 글로벌 혁신의 트렌드인 AI의 다양한 사례를 살펴보고 단계적으로 어떻게 접근하고 준비해야 할지를 알려드립니다. 이미지/비디오 인식 등 AI 어플리케이션의 유형과 트렌드를 전달드립니다. 특히 AWS AI 서비스를 성공적으로 도입하고 활용하기 위한 전략을 살펴보고 사례를 통한 Use Case를 통해 단계별 접근 전략을 소개드립니다. 이번 세미나를 통해 최신 AI트렌드와 정의, 그리고 사례 기반의 도입 유형, 접근 전략과 방법론 등을 알 수 있습니다.
더 많은 AWS 온라인 세미나 알아보기: https://aws.amazon.com/ko/events/webinars/series
스타트업은 데이터를 어떻게 바라봐야 할까? (개정판)Yongho Ha우리 회사는 데이터를 볼 필요가 있을까?
봐야 한다면 어떻게 해야 할까?
스타트업이든, 큰 기업이든
데이터가 왜 필요하며, 어떤 기법들로 분석해 나갈 수 있는지 설명합니다.
퍼널, A/B 테스트, 코호트 분석등에 대해 쉽게 설명합니다.
데이터 분석에 필요한 기본 개념: 지표, Funnel 등 데이터를 이해하기 위한 멘탈 모델(Mental Model)Minwoo Kim- 강의록 전문 읽기: http://bit.ly/2KKtzRA
데이터 분석(데이터 사이언스 말고, 통상적으로 스타트업에서 '데이터 분석'이나 '그로스'에 쓰는 데이터 분석)을 공부하려면, 어떤 기본 개념을 가지고 계시면 좋을지에 대해 만들어 본 강의 자료입니다.
카우앤독에서 지인 위주로 꾸린 강의에서 꽤 좋은 평가를 받았으나, 강의안 준비가 너무 힘들어서 실제 유료 강의로 이어지지는 않은 비운의 슬라이드...
멘탈 모델이란 무엇인지, 지표는 무엇이며 퍼널(Funnel)은 무엇인지, 등등의 이야기를 합니다. 기승전 결론은 SQL 배우세요. (https://brunch.co.kr/@minu-log/4)
Little Big Data #1. 바닥부터 시작하는 데이터 인프라Seongyun ByeonThis document discusses using BigQuery and Dataflow for ETL processes. It explains loading raw data from databases into BigQuery, transforming the data with Dataflow, and writing the results. It also mentions pricing of $5 per terabyte for BigQuery storage and notes that Dataflow provides virtual CPUs and RAM. Finally, it includes a link about performing ETL from relational databases to BigQuery.
여기컨_스타트업 기획자의 월화수목금_이수지TechFeministgroup이수지님은 17년 8월 오픈하여 3개월 만에 facebook 50만 좋아요와 누적 100만 사용자, 누적 100만 다운로드, 120만 AU를 달성한 타로챗봇 라마마와 친구들, 헬로우봇(http://hellobot.co/)의 기획자 겸 대표입니다.
#여기컨18 에서는 "스타트업 기획자의 월화수목금"이라는 제목으로 헬로우봇 리서치부터 출시, 운영까지 시기별 기획자의 한 주를 공유해주셨습니다.
BigQuery의 모든 것(기획자, 마케터, 신입 데이터 분석가를 위한) 입문편Seongyun ByeonThe document contains log data from user activities on a platform. There are three columns - user_id, event, and event_date. It logs the activities of 5 users over several days, including events like logins, posts, comments, views. It also includes some aggregated data on unique events and totals by user.
Bigquery와 airflow를 이용한 데이터 분석 시스템 구축 v1 나무기술(주) 최유석 20170912Yooseok Choi9월 12일 구글 클라우드 데이 @ 판교 에서 구글 빅쿼리와 아파치 에어플로우를 이용한 데이터 분석 시스템 구축이라는 주제로 발표한 자료입니다.
오늘 밤부터 쓰는 google analytics (구글 애널리틱스, GA) Yongho Hahttp://ga.yonghosee.com 에서 진행하는 구글 어날리틱스(google analytics) 에 대한 강의 슬라이드 입니다. 이 슬라이드는 샘플이지만, 초반부는 실재 강의 교재 그대로 입니다. 이것 자체로도 여러분이 GA를 이해하는데 좀 도움이 된다면 기쁘겠습니다^^ 감사합니다.
디지털 트윈 기술과 활용 사례 - 공간정보를 중심으로 SANGHEE SHINLX공간정보 아카데미의 '공간정보 기반의 스마트시티 비즈니스 모델 개발' 과정에서 강의한 자료입니다. 디지털 트윈의 개념, 연원, 도시/국토관리로의 확장, 공간정보 분야의 동향과 전망, 디지털 트윈 기반 스마트시티, 오픈소스 기반 디지털트윈 플랫폼인 mago3D, 그리고 mago3D를 적용한 대표적인 사례 등에 대해 소개하였습니다.
A future that integrates LLMs and LAMs (Symposium)Tae Young LeePresentation material from the IT graduate school joint event
- Korea University Graduate School of Computer Information and Communication
- Sogang University Graduate School of Information and Communication
- Sungkyunkwan University Graduate School of Information and Communication
- Yonsei University Graduate School of Engineering
- Hanyang University Graduate School of Artificial Intelligence Convergence
Python과 Tensorflow를 활용한 AI Chatbot 개발 및 실무 적용Susang Kim도입
AI Chatbot 소개
Chatbot Ecosystem
Closed vs Open Domain
Rule Based vs AI
Chat IF Flow and Story Slot
AI기반의 학습을 위한 Data 구성 방법
Data를 구하는 법 / Train을 위한 Word Representation
Data의 구성 / Data Augmentation(Intent, NER)
자연어처리 위한 AI 적용 방안
Intent (Char-CNN) / QnA (Seq2Seq)
Named Entity Recognition (Bi-LSTM CRF) / Ontology (Graph DB)
Chatbot Service를 위한 Architecture 구성
Chatbot Architecture
NLP Architecture
Web Service Architecture
Bot builder / Chatbot API
Test Codes for Chatbot
실무에서 발생하는 문제와 해결 Tips
Ensemble and voting / Trigger / Synonym(N-Gram)
Tone Generator / Parallel processing / Response Speed
마무리
[설명 코드]
Text Augmentation / Slot Bot / QA Bot / Graph DB / Response Generator
AI_introduction and requirements(2024.05.12).pdfLee ChanwooAI_introduction and requirements, Considerations for introducing artificial intelligence, understanding machine learning, artificial intelligence security, considerations for introducing ChatGPT, future of generative AI
2023 체인지온@미디토리_김재인 연사 발표자료ChangeON@2023 체인지온@미디토리
<인공지능(AI)과 활동하는 삶>
[세션1] 위기는 인공지능에서 오지 않는다
-강연1. 생성 인공지능의 시대, 확장된 인문학의 대응 | 김재인
[세션2] 보이지 않는 노동, 가려지는 데이터들
-강연2. AI가 말하지 않는 것들 | 조경숙
-강연3. 나의 고독사 예방 대책에 AI가 없는 이유 | 권종호
[세션3] 인공지능의 미로에서 나침반 찾기
-강연4. 재난, 데이터셋 그리고 기계의 우화 | 최빛나
-강연5. 시민활동가가 인공지능 기술을 만났을 때 | 김재섭
파이썬을 활용한 챗봇 서비스 개발 3일차Taekyung HanPython을 활용한 챗봇 서비스 개발 3일차 강의자료입니다. 3일차 강의에서는 Tensorflow 개요, Vectorization, Generative chatbot 및 카카오톡 챗봇 연동에 대하여 설명합니다.
PyCon2020 NLP beginner's BERT challengeYoongi Kim1. BERT 모델 소개
2. BERT 모델을 활용한 KorQuAD 2.1 도전기
3. 2달 동안의 시행착오 - Hugginface Transformers, 한국어 인코딩 문제, 멀티프로세싱 최적화 등
4. 앞으로 계획 - 한국어 GPT-3 도전
[코세나, kosena] Auto ML, H2O.ai의 헬스케어분야 AI 활용 사례kosenaH2O.ai, founded in 2012 in Silicon Valley, aims to enhance healthcare through AI, boasting a strong community and significant funding, totaling $152 million. The organization provides a range of AI solutions tailored for the healthcare sector, including applications in pharma, provider operations, and disease management. Recognized for its innovations, H2O.ai strives to democratize AI and has established partnerships with notable healthcare companies while emphasizing the importance of explainable AI.
[코세나, kosena] Auto ML, H2O.ai의 보험분야 활용사례kosenaThe H2O.ai Insurance Use Case Catalog outlines various AI applications tailored for the insurance sector, including pricing, underwriting, claims management, fraud detection, and customer experience optimization. Each use case provides objectives, outcomes, business value, and specific AI methodologies, along with tools designed to automate processes and enhance decision-making. Key features include improved accuracy in claims processing, customer retention strategies, and advanced data analytics to foresee risks and market behaviors.
[코세나, kosena] Auto ML, H2O.ai의 제조분야 AI 활용 사례kosenaThe document discusses the shift towards intelligent manufacturing, highlighting the importance of AI in enhancing operational efficiency and decision-making. It presents case studies and examples of successful AI implementations across various industries, outlining specific use cases and the potential value they can drive. Additionally, it emphasizes the H2O.ai cloud platform's capabilities in democratizing AI and enabling organizations to achieve significant returns on investment through AI transformation.
[코세나, kosena] 빅데이터 구축 및 제안 가이드kosena빅데이터 구축 및 술루션 가이드 주요 내용
- 고객 내부 빅데이터 프로젝트 진행시 단계별 진행 가이드
- 빅데이터 프로젝트 구축 타입
- 각 산업분야별로 빅데이터 엔진을 활용한 솔루션 구축 가이드
(딥 러닝 기법 기반의 분석 포함)
코세나(kosena), 이승훈 실장 admin@kosena.kr, kosena21@naver.com
010-9338-6400
[코세나, kosena] 빅데이터 기반의 End-to-End APM과 비정형 데이터 분석 자료입니다.kosena빅데이터 기반의 End-to-End APM 사례, 그리고 비정형 데이터 분석 사례 자료입니다.
코세나(kosena), 이승훈 실장 admin@kosena.kr, kosena21@naver.com
010-9338-6400
[코세나, kosena] FDS(Fraud Detection System) Securitieskosena스플렁크로 구축한 빅데이터 기반의 FDS 사례 자료입니다...
방대한 내부 데이터를 분석하여 실시간으로 통제하는 빅데이터 기반의 FDS(Fraud Detection System)으로 기존의 배치성이거나 특정 분야만 지원하는 FDS가 아니라 모든 금융 및 기업 내외부의 부정행위를 분석하고 모니터링합니다...
이제 진정한 FDS를 구축하실 수 있습니다...
코세나(kosena), 이승훈 실장 admin@kosena.kr, kosena21@naver.com
010-9338-6400
12. 서비스 구분 서비스명 웹사이트 과금 서비스설명
채팅 Chat-GPT https://ai.com 무료,유료 openai에서 만든 대화형 AI
채팅 GPT API https://platform.openai.com/playground 유료 API를 통해 GPT를 사용할 수 있음.
번역 DeepL https://www.deepl.com/translator 무료,유료 AI를 통해 번역을 해 줌
채팅 poe https://poe.com/ 무료 4가지 Chat-AI를 비교해볼 수 있음
파워포인트 beautiful https://www.beautiful.ai/ Freemium 텍스트를 입력하면 PPT로 만들어 줌
채팅 character https://beta.character.ai/ 무료 원하는 캐릭터와 채팅을 할 수 있음
받아쓰기 다글로 https://daglo.ai/ 무료,유료 음성을 텍스르로 변환
AI llama-dl https://github.com/shawwn/llama-dl 무료 메타에서 나온 LLAMA 유출본
프롬프트 promptbase https://promptbase.com/prompt 유료 프롬프트를 사고 파는 플랫폼
이미지 prompthero https://prompthero.com/ 무료 이미지를 키워드로 검색하고 그에 대한 프롬프트를 알아내는 서비스
채팅 native https://www.native.me 무료 모바일로 Chat-GPT를 이용할 수 있는 서비스. 한글로 입력하면 자동으로 영어로 물어보고, 답변을 한글로 보여줌.
프롬프트 learnprompting https://learnprompting.org/ 무료 프롬프트 작성법 배우는 곳
프롬프트 prompt-generator https://prompt-generator.cckn.vercel.app/ 무료 DAN 모드로 프롬프트 작성해주는 곳
이미지 DALL-E2 https://openai.com/product/dall-e-2 무료,유료 텍스트를 이미지로 바꿔주는 Openai 서비스
이미지 lexica https://lexica.art/ 무료 이미 생성된 AI 이미지를 검색으로 보여주는 서비스
이미지 vanceai https://vanceai.com/?medium=top_nav_logo Freemium 이미지 해상도를 AI로 개선시켜주는 서비스
이미지 scribblediffusion https://scribblediffusion.com/ 무료 대충 선을 그리면 멋진 그림으로 만들어주는 서비스
정보 교원을 위한 인공지능 https://bit.ly/41TlSBt 무료 교원을 위한 인공지능 첫걸음 (서울시교육청)
마인드맵 whimsical https://whimsical.com/ 무료,유료 인공지능 마인드맵
채팅 chat.d-id https://chat.d-id.com/ 무료,유료 음성으로 채팅을 하고 AI와 얼굴을 보며 대화
크롬확장프로그램 프롬프트 지니 https://bit.ly/aigptauto 무료 ChatGPT 자동 번역기, 한글로 입력하면 영어로 프롬프트를 넣어줌
크롬확장프로그램 ShareGPT https://bit.ly/aigptshare 무료 ChatGPT에서 작성한 채팅을 URL로 공유 가능하게 만들어줌
크롬확장프로그램 YouTube Summary https://bit.ly/AIYOUTUBE 무료 Youtube 영상의 내용을 텍스트로 요약해줌.
크롬확장프로그램 ChatGPT Writer https://bit.ly/AIEMAIL 무료 이메일을 chatgpt로 작성해줌
크롬확장프로그램 ArxivGPT https://bit.ly/ARXIVGPT 무료 Arxiv에 있는 논문을 요약해줌
크롬확장프로그램 AIPRM https://bit.ly/3JrVE1M 무료 다른 사람들이 저장해둔 프롬프트를 사용할 수 있음
크롬확장프로그램 ChatGPT Optimizer https://bit.ly/3Jr9b9E 무료 인터페이스에 기존 ChatGPT에 없던 여러 기능을 넣어줌
크롬확장프로그램 GoogleChatGPT https://bit.ly/41ZzivK 무료 프롬프트를 입력하면 구글에서 검색 결과를 넣어줘서 최신 정보 가능
크롬확장프로그램 WebChatGPT https://bit.ly/3YGnsE0 무료 프롬프트를 입력하면 구글에서 검색 결과를 넣어줘서 최신 정보 가능
채팅 AskUP http://pf.kakao.com/_BhxkWxj 무료,유료 카카오톡에서 ChatGPT를 사용할 수 있음. 친추 후 사용. by 업스케일
채팅 native https://www.native.me/ 무료 모바일에서 한글로 입력하면 영어로 프롬프트를 넣어주는 ChatGPT API 서비스
파워포인트 tome https://beta.tome.app 무료 텍스트를 넣으면 PPT를 만들어주는 서비스
API FutureTools https://www.futuretools.io/ 무료 AI 도구 모음 사이트
영상 pictory https://pictory.ai/ 유료 스크립트를 넣으면 영상으로 제작해주는 서비스
정보 theresanaiforthat https://theresanaiforthat.com/ 무료 유용한 AI 정보 모음
정보 AI Tool Master List https://bit.ly/41VdOjA 무료 유용한 AI 정보 모음
문서요약 Chat with any PDF https://www.chatpdf.com/ 무료 PDF 파일 내용 요약 서비스
문서요약 filechat https://www.filechat.io/ 무료,유료 PDF, docx, html, txt 내용 요약 서비스
사이트생성 Mixo https://app.mixo.io/ 유료 랜딩페이지를 만들어주는 서비스
이미지 sporky https://sporky.ai/ 무료 텍스트를 이미지로 만들어주는 서비스
Generative AI 도구 모음
14. 1.챗GPT로 홍보 시나리오를 만들고
https://chat.openai.com/auth/login?next=/chat
2.미드저니로 AI 그림을 그린 후에
https://www.midjourney.com/home/?callbackUrl=%2Fapp%2F
3.네이버 클로바로 음성을 합성하고
https://clova.ai/voice
4.D-ID로 모양 AI영상과 자막맞춤 AI기능을 사용하여
https://www.d-id.com/
저희 파트너사의 회사 홍보 영상을 30분만에 뚝딱 만들어 낸 결과물
https://www.youtube.com/watch?v=WZLTGDkGeww
Generative AI 활용은 -> 30분만에 회사 홍보 영상
16. 엔터테인먼트 및 미디어: 생성형 AI는 이미 게임이나 영화를 위한 더욱 사실적이고 몰입감
있는 가상 환경을 만드는 데 사용되고 있다.
전자상거래: 생성형 AI는 고객 데이터를 분석하고 제품·서비스에 대한 개인화된 추천을 생
성하는 데 사용되고 있다. 이를 통해 기업은 마케팅·판매 전략을 개선하고 고객 만족도와
충성도를 높일 수 있다.
의료: 생성형 AI를 사용하여 의료 이미지를 분석하고, 의사가 질병을 더욱 정확하고 빠르게
식별하고 진단할 수 있다. 또 다양한 질병에 대한 신약·치료법을 개발하는 데 사용될 수 있
다.
교육: 생성형 AI를 사용하여 학생을 위한 개인화된 학습 경험을 만들고 대화형 교육 콘텐트
를 생성할 수 있다.
제조 및 설계: 생성형 AI를 사용하여 새로운 제품 설계·제조 프로세스를 생성하고 공급망·
물류 운영을 최적화할 수 있다. 이를 통해 기업은 비용을 절감하고 효율성을 높일 수 있다.
Generative AI 활용분야는?
22. -22-
AI 알고리즘, Transformer와 그 후
□ 인공지능 모델의 발전은 2017년 Transformer가 분기점
• Transformer는 CNN, RNN 계열의 신경망 구조를 탈피한 Attention 메커니
즘만으로 구현
입력 데이터를 병렬적으로 처리하며, 모델의 품질, 훈련시간 면에서 효율
적이다
• 2017년 구글에서 내놓은 “Attention is all you need”라는 논문에서 처음 발
표
2021, NIA, 「IT & Future Strategy 보고서」
23. -23-
BERT와 GPT의 차이
□ Transformer 는 Encoder와 Decoder로 이루어짐
• Encoder를 중심으로 일부 알고리즘을 변경하여 BERT를 개발(현재 구글
번역엔진)
• Decoder에서 Multi-Head Attention을 제거하고 파라미터수를 늘린 모델이
GPT
29. ✅ Open AI가 만든 초거대 언어 생성 모델을 이용한
AI 챗봇
[Ref] On the Opportunities and Risks of Foundation Models – https://arxiv.org/abs/2108.07258
모든문제해결의기반이되는Foundation Model의등장
엄청난양의데이터를이용한사전 훈련(pre-train)으로범용모델
생성
Foundationmodel에Adaptation(orFine-tuning)과정을통해
각각의application/task에적용
ٳұʰ랶
30. ✅ Open AI가 만든 초거대 언어 생성 모델을 이용한
AI 챗봇
단어가리고맞추기형태로사람의개입없이도수많은데이터를학습가능
자가 지도(Self-supervised)를이용한사전학습(Pre-training)이가능
초거대모델의경우언어를단순기호로처리하는성능이발현되어프롬프
트만으로 새로운걸학습이가능:In-Context Learning/Prompt Learning
프롬프트를어떻게잘쓰는지에따라모델의동작방식이달라지기때문에최
근에는
프롬프트엔지니어링이라는분야도생김
Make The World Smarter with SOSLAB
Make The World ? with SOSLAB
ٳұʰ랶
33. 33
ChatGPT :
API
GPT3 : Fine-
Tunning
ChatGPT 사용법
둘 다 인터넷 연결이 항상 되어야 하며 클라우드 기반임(로컬 구축이 안됨)
API만 지원, Fine-Tuning안됨, 낮은 사용료
GPT 3.5/4.0
Fine-Tuning지원, 매우 높은 사용료
39. 🆗할 것
- 그것이무엇이든초안을작성할때매우유용함(시간을매우절약함)
- 시킬때구체적인내용을prompt에함께줄것(e.g.자세하게,친근하게,혁신적인표현으로,한국어로,영
어로등)
- 시키는일의예시를보여주면좀더잘함(Few-shot)
- 항상내용을보고자세히읽고체크를해야함
- 영어로입력하고만들어진결과를한국어로번역하면보통퀄리티가더좋음(전문지식에가까운것일수
록더욱)
- 인터랙티브하게활용할것(e.g.위의결과에이렇게더해줘…)
- 매우그럴듯하지만일반적인수준이많아서본인만의차별화된내용추가필요
- 언어사용문화나법적인부분은학습이덜되어있음.사용시주의필요
🚫 하지 말 것
- 검색같이정확한답을기대하면안됨!(글을 잘 쓰는 AI일 뿐 그것이 Fact라는 보장 못함)
- 정확한내용이필요한글은내용이정확해야하는부분을반드시더블체크해야함.
- 최신지식을물어보지말것(지금집을사야할까?주식이런거사야하나?X)←2021.09데이터까지
학습
ChatGPT가 촉발한 초거대 AI시대 우리의 대응 전략 (하정우 / NAVER AI Lab 연구소장)
ChatGPT 활용가이드
40. 프롬프트 작성을 위한 TIP
1. 프롬프트(입력문)를처음입력했을때,원하는결과를바로얻기는어려워요.만족스러운결과를얻을때까지입력, 테스트, 수정을 반
복해보세요.
2.광범위한질문보다는구체적인 단어를 포함해서 질문할 때 효과가높아요.대화의초점이나방향이불명확한경우,필요한답변
을받기어려워요. 자세히알고싶은주제와관련된세부정보나예시등추가정보를함께입력하세요.
❌ BAD:UX디자인에대해말해줘.
👍 BETTER:소규모스타트업을위한UX디자인의중요성에대해블로그포스팅을작성해줘.
3. 특정 역할을 요청하는건AI가요청의맥락을이해하도록만드는좋은장치가될수있어요!
👍“
영어선생님처럼내작문의문법실수를지적해줘.”
👍 Actas~:영문으로ChatGPT입력문을작성할때는“Actas~”로입력문을시작하면좋아요.(e.g.,마케터처럼,PM처럼,면접관처럼)
4. 다양한답변 형식을 요청할수있어요.
👍”이메일형식으로써줘/블로그포스팅의개요를작성해줘/표를그려줘/엑셀시트형식으로답변해줘/파이썬,HTML코드를작
성해줘”
[Ref] ChatGPT 활용 가이드(프롬프터 자료) / 헤이조이스
ChatGPT 활용가이드
41. 보고서 작성
즉시 제출할 수 있는 보고서 작성
법령, 규정 등 검색 챗봇 활용
새로운 아이디어 탐색
YouTube 추천 같은 개인화 서비스
“나” 맞춤형 업무 지시
한글, 엑셀 등 문서 서식 변환
같은 내용을 다른 어조로 변환
단락을 요약하거나 번역하기
그림 그리기
표 해석시키기
한글, 영어 모두 가능. 분량 지정
가능
허위 사실 포함 가능. 사실 검증
필수.
사실에 민감하거나
최신성 중요 서비스는 위험
사실 관계와 무관하게 생각의 범
위 확장 가능.
동일 창에서만 기억 유지. 다시 접속
하면 초기화됨.
“나”에 대한 정보가 필요함.
RPA(업무 자동화)를 쓰세요.
예) 전문적 대중적
예) 영어 한국어
DALL.E, Stable Diffusion
등 별도 전문 모델 사용.
예) 동향 요약, 평균 출력
1
2
3
4
5
6
7
8
9
10
11
ChatGPT 활용가이드
42. ChatGPT 챗봇
LG전자의 “Home Chat”
- 홈챗은 모바일 메신저(카카오톡, 라인)를 이용해 집안의 가전제품과 채팅 하며 이러한 가전제품을 제어
할 수 있는 스마트홈 챗봇 서비스
- 매달 평균 1만 6,000여 가구, 하루 평균 550여 가구가 가입하고 있으며 2016년 1월 누적 가입자 가구 10
만 가구를 돌파
46. • 아주 큰 모델과 아주 많은 양의 텍스트를 사용해서 자연어를 이
해하고 생성할 수 있도록 학습된 모델
• attention과 transformer를 기반으로 한 BERT, ELMo, GPT 시리
즈 등
• 언어 모델링, 문장 생성, 질의응답, 요약, 번역 등 다양한 자연어
처리 작업을 수행
AI 구현시의 이슈
LLM이란?
48. 구분 BERT GPT(GPT-1)
제작 Google OpenAI
출시 공개: 2018.11. (출시: 2019.10.) 공개: 2018.6.
학습
데이터
총 33억 개의 단어로 언어모델 학습
- 위키백과 25억 개, 도서말뭉치 8억 개
7천 권의 도서 말뭉치 데이터로 모델 학습
- 이후 미세 조정을 위한 과업별 데이터 활
용
구조
Base 모델: 인코더12개, 어텐션헤드12개, 학
습모수(파라미터) 1.1억 개
Large 모델: 인코더 24개, 어텐션헤드 16개,
학습모수(퍼라미터) 3.3억 개
디코더 12개, 어텐션 헤드는 각 디코더별12
개, 학습모수(파라미터) 1.17억 개
특징
텍스트 데이터 중간을 빈 칸(마스크)으로 설
정 하여 예측하는 기법과 다음 문장 예측을
동시에 학습시켜 범용 언어모델 구축
트랜스포머를 언어모델 학습에 활용하기
위 해 초점, 학습된 언어모델이 재학습에
효 율이 높은점을 착안하여 GPT2, GPT3
개발
모델명 크기변화(파라미터 수) 변화량
GPT(GPT1) 0.117B -
GPT2 1.5B GPT1 대비 12.8배
GPT3 175B GPT2 대비 117배
GPT3.5(ChatGPT) 1.3B, 6B, 175B “
도표 5 GPT-3 모델학습 데🕔터 규모
※ 자료: OpenAI, 언론기사, 삼일PwC경영연구
원
GPT-3
(총 753.4GB
)
웹 데이터
(570GB)
웹 문서
(50GB)
바이블리오틱e
북
(101GB)
위키피디아
문서 (11.
4GB)
구텐베르크
프로젝트 e
북 (21GB)
AI 구현시의 이슈BERT와 GPT 비교
49. • 데이터셋의 한계
LLM은 대규모의 데이터셋에서 학습되어야 하지만, 실제로는 모든 분야와 언어에 대한 충
분한 양의 데이터가 준비되어 있지 않다.
• 계산 리소스의 한계
LLM은 매우 큰 모델이기 때문에 학습 및 추론에 많은 계산 리소스가 필요. 따라서 이러한
모델을 학습하기 위해서는 대규모의 컴퓨팅 클러스터 또는 전용 하드웨어가 필요하다.
한정적인 데이터셋과 컴퓨터 하드웨어를 가지고는 처음부터 Train 시킬 수 없다.
이미 pretrained된 모델을 가져와서 Fine-Turning 하게 되면 시간 및 비용을 아낄 수 있다.
AI 구현시의 이슈
LLM의 한계점
50. • OpenAI : GPT-3, 상용 버전
(API 사용 – 비용 발생)
• GPT-J : GPT3의 오픈소스 버전
• Google : BERT
• Facebook : RoBERTa
(기존 BERT 모델 유지, 성능 ↑)
• SKT-AI : KoGPT
• Meta의 LLaMA : 오픈소스 버전
• DistilBERT
AI 구현시의 이슈
로컬로 구축가능한 LLM(빨간색)
로컬로 저비용으로 LLM을 구축하고 ChatGPT 성능을 내기 위해서는
빨간색으로 된 알고리즘 활용이 가장 현실적임
51. • GPT-3
https://lsjsj92.tistory.com/656
https://platform.openai.com/docs/guides/fine-tuning
• GPT-J : GPT-3의 오픈소스 버전
https://medium.com/ai-networkkr/ai-%EB%AA%A8%EB%8D%B8-%ED%83%90%ED%97%98%EA%B8%B0-21-gpt-
3%EC%9D%98-%EC%98%A4%ED%94%88%EC%86%8C%EC%8A%A4-%EB%B2%84%EC%A0%84-gpt-j-de3bdcdf65dd
• BERT
https://github.com/nlpyang/BertSum
• RoBERTa
https://huggingface.co/klue/roberta-small
• KoGPT
https://github.com/kakaobrain/kogpt
https://github.com/SKT-AI/KoGPT2/tree/3b3cbb79caed1ad8230ce6cb4b0cede94b353ec8#user-contributed-examples
https://www.youtube.com/watch?v=YLLGtpzupGQ
• Alpaca
https://github.com/tatsu-lab/stanford_alpaca#data-release
• DistilBERT
https://huggingface.co/docs/transformers/model_doc/distilbert
• 통합
https://github.com/kiyoungkim1/LMkor
AI 구현시의 이슈
로컬로 구축가능한 LLM 링크
52. AI 구현시의 이슈
로컬로 구축가능한 LLM 작업
자연어 데이터셋
(형태소분석기/
토크나이징)
GPU 서버
(4 GPU 장착 서버
2대 이상)
LLM 모델 선택
모델 검증
QA검증
“가장 중요”
54. 문서 a4 1,000만장 기준 ,1,800자 기준, 18,000,000,000 글자
LLM기반 질의 응답 구축
방법 자원 소요 기간 및 작업량
특정 BERT모델 기반
fine-tuning
(많이 적용된 방식)
학습서버 - 최소 NVIDIA A100 16GB
추론서버 - 최소 GeForce RTX 3090
< 6~7개월 소요 >
데이터 수집 및 전처리 : 3달
학습 및 검증 : 3개월 (학습당 ~2일)
웹서비스 개발 (추론)
ChatGPT API 사용
(GPT3는 fine-tuning 가능)
학습서버 - 최소 NVIDIA A100 16GB
추론서버 - 최소 GeForce RTX 3090
< 5~6개월소요 >
데이터 수집 및 전처리 : 3달
학습은 용량에 따라 과금 (현재 기능 제한적)
웹서비스 개발 (추론)
ChatGPT 오픈소스 사용
(최신 방식)
학습서버 - 최소 NVIDIA A100 16GB
추론서버 - 최소 GeForce RTX 3090
< 6~7개월 소요 >
데이터 수집 및 전처리 : 3달
학습 및 검증 : 3개월 (학습당 ~3일)
웹서비스 개발 (추론)
AI 구현시의 이슈
로컬로 구축가능한 LLM 작업
55. • 텍스트 분류(Text Classification)
감정 분석(Sentiment Analysis), 스팸 감지(Spam Detection) 등
• 개체명 인식(Named Entity Recognition, NER)
텍스트에서 특정 정보(이름, 날짜, 위치 등)를 추출
• 기계 번역(Machine Translation)
한 언어에서 다른 언어로 텍스트를 번역
• 질문 응답(Question Answering)
자연어 질문에 대해 텍스트에서 정확한 답변을 찾는 작업을 수행
• 텍스트 요약(Text Summarization)
긴 텍스트를 짧게 요약하는 작업을 수행할 수 있습니다.
• 텍스트 생성(Text Generation)
주어진 주제나 조건에 따라 새로운 텍스트를 생성
• 텍스트 완성(Text Completion)
주어진 텍스트의 빈칸을 적절한 단어나 문장으로 채우는 작업
AI 구현시의 이슈
LLM의 활용방안
56. 구분 분야 활용 내용
사용자 편의
성 향상
의료
24시간 의료상담, 개인화된 치료 지원으로 의료 전문가는 이를 활용하여 고 품질의 서비스 제공 가능
법률
일본의 벤고시(변호사)닷컴은ChatGPT 법률상담 서비스를 예고, 기존 법률 및 판례 소개 등 일반적인 정보 제공 상황에 활용
농업
방대한 양의 데이터로 학습된 AI는 토양의 상태와 그에 따른 최적화된 작물 및 종자 선정 등 정보를 제공하여 접근성 개선
창작 영역
패션
AI 코디, AI 사이징, 최신 트렌드 분석, 패션 디자인, 시장조사 등에 소비자의 특성과 변화를 파악하기 위해 활용
마케팅
마케팅 자동화, 컨텐츠 제작 활용, 광고 최적화 등 기존 사람의 노력과 시간이 소요되던 작업의 생산성 개선
프
로
그
래
밍
ChatGPT를 활용한 스켈레톤 코드 확보, 코드 분석, 디버깅 자동화 등을 통해 개발 속도 개선과 교육 편의성 증대
AI 구현시의 이슈
LLM의 활용방안
58. 도표 6 챗GPT와 같은AI 기술을 활용하여업무효율을높일수 있는 비즈니스분야 예시
마케팅· 영업 운영 IT
· 엔지니어링 법률 인사 인력최적화
마케팅및 영업콘텐
츠 (SNS, 기술서 등)
생성
생산상품관련 고객문의
사항 해결
복잡한 코딩 문제해결,
신규코드생성
계약, 특허출원 등 법적
문서 검토
인력 채용 시 사용될
면접 질문생성
사내 커뮤니케이션 기
능 최적화 (이메일발
송 자동화, 번역 등)
상품 및 서비스사용 가
이드북생성
프로세스에러, 생산 이
상, 상품결함등 파악 데이터테이블 자동 생
성
대량의규제 관련문서들
을 검토, 규제 변화추적
HR 업무 자동화 처리 (
Ex. 직원온보 딩, 복지,
규정 등 설명)
비즈니스 프레젠테이
션 생성
고객피드백 요약및
분석
프로세스 자동화를 통
해 고객서비스 향상
머신러닝 모델의훈련
정확도를 높이 기 위해
합성 데이터생성
공공 및 민간기관관
련 법적문서내 질의사
항 답변
온라인 회의 내용, 발
표 자료등 업무 요약
최적화된 영업방법추
출 하여 서비스
향상
문서분석을 통해 구체
적인 계약조건파악
사내 지식 포털관련
Q&A 자동화 처리
실시간 고객지원
서비스제공
고성능스캐너, 머신러닝
, 문서 인식등으로 회계
업무 자동화
※ 자료: 삼일PwC경영연구원
AI 구현시의 이슈
LLM의 활용방안