머신러닝 시그 세미나_(deep learning for visual recognition)Yonghoon KwonThis document discusses the history and development of deep learning and neural networks. It explains that early neural networks from the 1940s-1980s had limitations due to limited computational power. Starting in 2006, deep neural networks enabled more layers of representation to be learned from data in an end-to-end fashion. The document contrasts shallow learning approaches that used hand-crafted features with deep learning, which allows automatic feature extraction directly from data using trainable neural networks.
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)Myungjin Lee오늘날 인터넷의 보편화와 소셜 미디어 및 스마트 기기의 발전으로 인해 정보의 양이 급격히 증가함에 따라 비즈니스 영역에 있어서 새로운 기회와 도전의 시기를 맞고 있다. 빅 데이터라 불리는 이러한 수 많은 정보들은 기업이 효율적인 의사결정을 지원할 수 있도록 도와줄 수 있으며, 또한 다른 기업과의 비즈니스 경쟁에서 경쟁우위를 차지하는데 아주 중요한 역할을 한다. 이러한 의사결정을 지원하기 위해서는 빅 데이터를 효과적으로 분석할 수 있는 방법론이 필요할 뿐 아니라 이를 지원할 수 있는 다양한 인프라를 필요로 한다. 따라서 본 논문에서는 빅 데이터를 분석하기 위한 고급분석 기법과 이를 지원하기 위한 기술 요소들을 도출하고, 향후의 발전 방향에 대해 논하고자 한다. 이러한 분석 기법과 기술을 통한 정확하고 신뢰성 높으며 신속한 의사결정은 기업이 고객의 요구를 신속히 수용하고 반영함으로써 기업의 수익 창출 및 시장을 선점하는 중요한 요인으로 작용할 수 있다.
Recently, as the Internet, social-media, and smart devices have been spread and common, the amount of information increases incredibly. Nowadays, we are confronting new opportunities and challenges in every business area. Obviously, such huge amount of information which called Big Data is playing a significant role at many parts, like improvement of effective decision making. Therefore, many companies could maintain their competitiveness in the market place. In order to support firm’s decision making, we need not only the methodology for the effective analysis of Big Data, but also various infra-structure which could support the firm’s decision making. As a result, this paper discusses advanced analysis methodologies and it’s supporting technical factors. The firm’s decision which is based on such analysis and techniques is usually accurate, reliable, fast, receiving and refreshing customer’s feedback immediately, so the decision making plays an important role in the revenue creation and preempt of market share.
Automatic speech recognition system using deep learningAnkan DuttaThis document describes the development of an automatic speech recognition system using deep learning techniques. It discusses extracting MFCC features from audio signals and using a convolutional neural network for feature extraction, followed by a Gaussian mixture model-hidden Markov model for recognition. It also describes implementing a speech recognition system using the Kaldi toolkit on a digits dataset consisting of 10 speakers, as well as an automatic speaker recognition system using MFCC features and K-nearest neighbors classification. The speech recognition system achieved an accuracy of 72% and the speaker recognition system achieved 80% accuracy on the digits dataset.
Speech recognitionCharu JoshiSpeech recognition, also known as automatic speech recognition or computer speech recognition, allows computers to understand human voice. It has various applications such as dictation, system control/navigation, and commercial/industrial uses. The process involves converting analog audio of speech into digital format, then using acoustic and language models to analyze the speech and output text. There are two main types: speaker-dependent which requires training a model for each user, and speaker-independent which can recognize any voice without training. Accuracy is improving over time as technology advances.
2014_다중브라우저 지원 온라인 TTS 솔루션 웹톡스 제안서Justin Shin언제 어디서나
여러분이 걷고 있거나, 운전 중 이거나, 대중교통을 이용하고 있을 때, 눈이 피로해 쉬고 싶을 때, 너무 바빠서 여러 일을 한꺼번에 해야 할 때
웹이나 앱사용을 도와주는 기능이 필요합니다.
언제 어디서나, 장애와 남녀노소, 언어에 관계없이
누구나 웹과 앱을 등을 수 있도록 해주는
실시간 음성변환 기술을 활용한
웹톡스가 이런 문제를
해결해 줍니다.
효율적 모바일 서비스를 위한 AWS 빌딩블럭 - API Gateway 및 Device Farm을 중심으로 (윤석찬, AWS 테크에반젤리스트)Amazon Web Services KoreaAWS 월간 웨비나 8월 녹화 동영상은 아래 링크를 참고하십시오.
https://aws.amazon.com/ko/blogs/korea/category/webinar/
---
모바일 시장이 확대됨에 따라 적은 비용으로 더 빠르게 모바일 사용자를 대상으로 한 모바일 앱 및 웹 서비스를 개발하는 것이 점차 더 중요해지고 있습니다.
이 강연에서는 AWS가 제공하는 Amazon Cognito, Mobile Analytics 및 SNS 등 모바일 서비스들과 SDK를 통해 더 빠르게 모바일 서비스를 개발해 사용자의 요구 사항에 대응하고 확장성을 갖춘 모바일 앱을 만드는 방법에 대해알아봅니다.
또한, AWS Lambda라는 클라우드 함수를 이용한 손쉬운 비지니스 로직 구현, 새로 나온 Amazon DeviceFarm을 통한 자동화된 앱 테스트 및 Amazon API Gateway를 통한 모바일 백엔드 구축 방법 등 서버 없이도 효율적인 모바일 서비스 아키텍처를 구성하는 방법을 알려드립니다
머신러닝 시그 세미나_(deep learning for visual recognition)Yonghoon KwonThis document discusses the history and development of deep learning and neural networks. It explains that early neural networks from the 1940s-1980s had limitations due to limited computational power. Starting in 2006, deep neural networks enabled more layers of representation to be learned from data in an end-to-end fashion. The document contrasts shallow learning approaches that used hand-crafted features with deep learning, which allows automatic feature extraction directly from data using trainable neural networks.
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)Myungjin Lee오늘날 인터넷의 보편화와 소셜 미디어 및 스마트 기기의 발전으로 인해 정보의 양이 급격히 증가함에 따라 비즈니스 영역에 있어서 새로운 기회와 도전의 시기를 맞고 있다. 빅 데이터라 불리는 이러한 수 많은 정보들은 기업이 효율적인 의사결정을 지원할 수 있도록 도와줄 수 있으며, 또한 다른 기업과의 비즈니스 경쟁에서 경쟁우위를 차지하는데 아주 중요한 역할을 한다. 이러한 의사결정을 지원하기 위해서는 빅 데이터를 효과적으로 분석할 수 있는 방법론이 필요할 뿐 아니라 이를 지원할 수 있는 다양한 인프라를 필요로 한다. 따라서 본 논문에서는 빅 데이터를 분석하기 위한 고급분석 기법과 이를 지원하기 위한 기술 요소들을 도출하고, 향후의 발전 방향에 대해 논하고자 한다. 이러한 분석 기법과 기술을 통한 정확하고 신뢰성 높으며 신속한 의사결정은 기업이 고객의 요구를 신속히 수용하고 반영함으로써 기업의 수익 창출 및 시장을 선점하는 중요한 요인으로 작용할 수 있다.
Recently, as the Internet, social-media, and smart devices have been spread and common, the amount of information increases incredibly. Nowadays, we are confronting new opportunities and challenges in every business area. Obviously, such huge amount of information which called Big Data is playing a significant role at many parts, like improvement of effective decision making. Therefore, many companies could maintain their competitiveness in the market place. In order to support firm’s decision making, we need not only the methodology for the effective analysis of Big Data, but also various infra-structure which could support the firm’s decision making. As a result, this paper discusses advanced analysis methodologies and it’s supporting technical factors. The firm’s decision which is based on such analysis and techniques is usually accurate, reliable, fast, receiving and refreshing customer’s feedback immediately, so the decision making plays an important role in the revenue creation and preempt of market share.
Automatic speech recognition system using deep learningAnkan DuttaThis document describes the development of an automatic speech recognition system using deep learning techniques. It discusses extracting MFCC features from audio signals and using a convolutional neural network for feature extraction, followed by a Gaussian mixture model-hidden Markov model for recognition. It also describes implementing a speech recognition system using the Kaldi toolkit on a digits dataset consisting of 10 speakers, as well as an automatic speaker recognition system using MFCC features and K-nearest neighbors classification. The speech recognition system achieved an accuracy of 72% and the speaker recognition system achieved 80% accuracy on the digits dataset.
Speech recognitionCharu JoshiSpeech recognition, also known as automatic speech recognition or computer speech recognition, allows computers to understand human voice. It has various applications such as dictation, system control/navigation, and commercial/industrial uses. The process involves converting analog audio of speech into digital format, then using acoustic and language models to analyze the speech and output text. There are two main types: speaker-dependent which requires training a model for each user, and speaker-independent which can recognize any voice without training. Accuracy is improving over time as technology advances.
2014_다중브라우저 지원 온라인 TTS 솔루션 웹톡스 제안서Justin Shin언제 어디서나
여러분이 걷고 있거나, 운전 중 이거나, 대중교통을 이용하고 있을 때, 눈이 피로해 쉬고 싶을 때, 너무 바빠서 여러 일을 한꺼번에 해야 할 때
웹이나 앱사용을 도와주는 기능이 필요합니다.
언제 어디서나, 장애와 남녀노소, 언어에 관계없이
누구나 웹과 앱을 등을 수 있도록 해주는
실시간 음성변환 기술을 활용한
웹톡스가 이런 문제를
해결해 줍니다.
효율적 모바일 서비스를 위한 AWS 빌딩블럭 - API Gateway 및 Device Farm을 중심으로 (윤석찬, AWS 테크에반젤리스트)Amazon Web Services KoreaAWS 월간 웨비나 8월 녹화 동영상은 아래 링크를 참고하십시오.
https://aws.amazon.com/ko/blogs/korea/category/webinar/
---
모바일 시장이 확대됨에 따라 적은 비용으로 더 빠르게 모바일 사용자를 대상으로 한 모바일 앱 및 웹 서비스를 개발하는 것이 점차 더 중요해지고 있습니다.
이 강연에서는 AWS가 제공하는 Amazon Cognito, Mobile Analytics 및 SNS 등 모바일 서비스들과 SDK를 통해 더 빠르게 모바일 서비스를 개발해 사용자의 요구 사항에 대응하고 확장성을 갖춘 모바일 앱을 만드는 방법에 대해알아봅니다.
또한, AWS Lambda라는 클라우드 함수를 이용한 손쉬운 비지니스 로직 구현, 새로 나온 Amazon DeviceFarm을 통한 자동화된 앱 테스트 및 Amazon API Gateway를 통한 모바일 백엔드 구축 방법 등 서버 없이도 효율적인 모바일 서비스 아키텍처를 구성하는 방법을 알려드립니다
음성인식 기반 홈IoT 제품서비스 동향 및 시사점 스마트홈산업협회 (순천향대학교 김학용 교수)Hakyong Kim한국스마트홈산업협회의 이슈리포트에 게재된 글입니다. 아마존 에코, 구글의 구글홈, SKT의 누구 등 다양한 음성인식 기반의 개인비서 서비스 장치를 소개하고 있고, 이런 기술들이 등장하게 된 배경 및 향후 고려해야 할 이슈 사항들에 대해서도 함께 언급하고 있습니다. Amazon Echo, Google Hom
음성인식 기반의 지역 캐릭터 시스템JUNGHUN LEE2017 스마트창작터 시장검증계획서
음성인식 기반의 지역 캐릭터 시스템
흄 대표 이정헌 작성
음성으로 사용자가 원하는 서비스를 찾아서 실행시켜 준다.
SMS 및 카카오톡으로 인공지능 대답 및 채팅이 가능한 서비스로 확장.
사용자가 질문하는 내용으로부터 사용자 요구사항 통계 및 빅 데이터 도구 제공.
채팅에 제한하지 아니하고, 버스노선, 기차시간, 지역 날씨, 쇼핑몰 옷까지 다양한 분야에서 음성과 채팅으로 서비스를 확장해 나가는데 자연스럽다.
[maum.ai] 3 Foundation model based Embodied AI products_Kor V1.0Taejoon YooOur 3 Foundation Modules are modular solutions developed around our core technologies: the Language Model (MAAL), Voice Conversation Model (SUDA), and Autonomous Driving Model (WoRV). These modules are designed for seamless integration across various application environments, including on-premise AI, on-device AI, and end-to-end autonomous driving. They deliver optimal performance and exceptional scalability to meet diverse business needs.
Monthlyhands ver 3.0 터치의 시대 리모콘은 변하고 있다HANDSTUDIOMONTHLY HANDS는 스마트TV 산업의 동향을 공부하고 분석하여 엮어내는
handstudio의 월간 정기 간행물입니다.
바야흐로 ‘터치의 시대’ 이지만, TV는 터치 하기엔 ‘가까이 하기엔 너무 먼 당신’ 입니다.
현재 스마트TV 시장의 양대 산맥인 삼성과 LG의 고민 중,
적어도 ‘어떻게 더 편리하게 컨트롤할까?’ 가 포함되어 있는 것만은 확실합니다.
MONTHLY HANDS 4월호에서는
스마트TV 입력장치의 변화와
이를 활용한 애플리케이션의 소식들을 고루 담았습니다.
MOTHLY HANDS와 함께 기쁘고, 유익한 봄날 되셨으면 좋겠습니다.
감사합니다.
[AWS Innovate 온라인 컨퍼런스] 한국어를 위한 AWS 인공지능(AI) 서비스 소개 및 활용 방법 - 강정희, AWS 솔루션즈 아키텍트Amazon Web Services Korea발표자료 다시보기: https://youtu.be/LZO07BaPW78
언어와 문자에 대한 이해는 인공지능 기술의 대표적인 주제입니다. AWS는 인공지능에 대한 깊은 이해나 투자 없이도 손쉽게 이를 활용할 수 있도록, 2017년 부터 다양한 AI 언어 서비스들을 발표하였습니다. 이러한 AI 언어 서비스들은 최근의 Amazon Comprehend 사례와 같이 지속적으로 한국어 지원을 추가하고 있습니다. 본 세션에서는 AI 언어 서비스와 문서 인식 서비스인 Textract를 활용하여 여러분의 애플리케이션에 비즈니스에 필요한 인사이트를 손쉽게 추가할 수 있는 다양한 사용 사례를 데모와 함께 알아봅니다.
2. DefinitionVoice User Interface Technology Speech Recognition:Translate voice language into digital signal. Into Text, or Device instructionApplication : Speaker recognition . Language Recombinationhttp://ettrends.etri.re.kr/PDFData/20-5_001_015.pdf
3. Utilization음성인식 문자&E-mail’말로 쓰는 구글모바일 서비스’- 편의 · 작은 자판으로 인한 오타의 불편을 없애줌 · 차량 운행 등 손이 불편한 상황에서 유용함 · 시각장애인 문자,e-mail 서비스 이용가능- 기능 · 음성 문자,E-mail 보내기 · 음성 구글 토크 대화보완점 · '네' 같은 한국어가 영어 'net'으로 인식되는 오류, 띄어쓰기 오류 + 음성검색, 음성토크, 문자 동영상http://www.youtube.com/watch?feature=player_popout&v=p8-H-imGBy4
4. Utilization2. 음성 통역 Google 음성인식 자동통역기구글은 자동통역업계 가장 수준 높은 기술 보유 자동통역 무료 app 제공영어-한글 통역기– 짧은 문장은 대체로 정확함+) 시연 동영상 http://labofming.tistory.com/27Jibbigo app모바일테크놀로지에서 출시.9개국어 지원. 스마트폰 지원.효과 : 여행·관광뿐 아니라 서비스, 비즈니스 분야에서도 높은 활용도
5. 한계 - 소음이 적은 곳에서 문법에 맞게 정확한 발음이 필요하다.- 일본어-한글은 높은 정확도를 가지나, 영어와 어순이 다르기 때문에 긴 문장은 부정확하다.+) 동영상 http://tvpot.daum.net/clip/ClipViewByVid.do?vid=PiUEwfQU0Xg$
6. Speech recognition navigation2005년 IBM, Honda 합작 – Acura RL(기본사양)과Honda Odyssey(옵션)에장착주요 기능 : 거리명과 도시명을 음성으로 인식하는 능력natural-sounding text-to-speech system : noise elimination The breakthrough voice-recognition system can also enable enhanced ease-of-use by eliminating the need for drivers to take their hands off the wheel or eyes off the road, since no typing on touch screensor manual dialing is required."눈은 도로에, 두 손은 운전대에“Youtube Automatic Caption ( & AutomaticTiming) “Speech to text” algorithm BaseEnable people around the world to access video content in any of 51 languages.활용 전망 : open-course 학습 시 유용 (or Khan academy?)
7. Future & ConstraintConstraint - Operate program before use : Not ubiquitousTech in the Future - Enable Ubiquitous - Start with Speech recognition Tech, End by Speech Recognition Tech - Recognize each person’s voice -> security. Death of Key - Voice code recognition for Security systemEx) Movie “2012” Car operating system – “Engine Start~”
8. Beginning of A.I SystemNuance + IBM “Watson” for Medical ServiceFinally Speech recognition will be main Technology for Human Android.Machine recognize Human’s voice. Home appliance , Digital Device