- 台中縣
亞馬遜創新大會AWS Re:INVENT 推出4個重磅AI工具
时间:2010-12-5 17:23:32 作者:開心少女組 来源:藝鷺 查看: 评论:0
内容摘要:導讀:在今天的創新大會AWSRe:INVENT上,亞馬遜雲服務AWS的CEO,AndyJassy向4萬多個到場觀眾介紹了這一整套加速機器學習流程的托管服務,SageMaker。以及推出4個重磅AI工具 導讀:在今天的創新大會AWS Re:INVENT上,亞馬遜雲服務AWS的CEO,Andy Jassy向4萬多個到場觀眾介紹了這一整套加速機器學習流程的托管服務,SageMaker。以及推出4個重磅AI工具,視頻定向追蹤工具Amazon Rekognition Video tool,音頻轉文本Amazon Transcribe,情緒理解Amazon Comprehend,語言翻譯Amazon Translate。
機器學習現在已經在多個領域爆發出驚人的能量,企業通過獲取有效的用戶數據,可以高效鎖定用戶的需求,針對性地提供服務,營收利潤的拉升效果立竿見影。
但對於大多數急著上車的企業來說,自身業務結合人工智能技術最難的地方在於,沒有辦法迅速找到資深的AI專家來分析業務鏈,並搭建相應的機器學習模型解決核心問題,提升生產或者服務環節的效率。
亞馬遜敏銳地捕捉到了這個痛點,在今天的創新大會AWS Re:INVENT上,亞馬遜雲服務AWS的CEO,Andy Jassy向4萬多個到場觀眾介紹了這一整套加速機器學習流程的托管服務,SageMaker。以及推出4個重磅AI工具,視頻定向追蹤工具Amazon Rekognition Video tool,音頻轉文本Amazon Transcribe,情緒理解Amazon Comprehend,語言翻譯Amazon Translate。
SageMaker,是專門為想要加碼AI技術的企業和開發者量身打造的,端對端的機器學習服務。這個服務可以讓數據科學家,開發者,以及機器學習的專家可以快速搭建、訓練、托管一定規模的機器學習。
SageMaker的構成:
編碼
從零搭建帶有虛擬學習環境的Web應用程序,用來數據挖掘清理和處理。
開發者可以在這上麵跑常規類型的實例,或者GPU驅動的實例。
模型訓練
分布式模型的搭建、訓練、驗證服務。你可以直接用預裝好的監督學習或者無監督學習算法,也可以自己用Docer容器引擎訓練一個模型。
這種訓練可以數十倍地處理實例,這樣搭建模型的速度就超快的。訓練的數據從S3(全稱Amazon Simple Storage Service)讀取,生成的數據也會放進S3。經過模型生成的數據是基於模型的參數的,而不是模型演算出來的代碼。這樣分開處理,可以更好地用SageMaker來訓練用於其他平台的模型,比如那些物聯網設備。
模型托管
帶HTTPs端點的托管模型的服務,能讓開發者的模型拿到實時的演算。這些端點可以緩解流量壓力,也可以在多個模型上同時進行A/B測試。同樣,開發者可以直接使用內置的SDK搭建這些端點,也可以用Docker鏡像來設置你自己的參數。
“自誇一下,我覺得SageMaker端對端服務最強大的地方,是這三部分可以分開獨立使用,靈活地補充改進企業現有的機器學習工作流程,”在發布會上,AWS的CEO強調SageMaker的靈活性。“它既提供現成的工具,也可以允許開發者自己搭建。不管哪種選擇,這個服務都可以用上最主流的算法。”
△ AWS的CEO,Andy Jassy
預設好的Jupyter Notebook,內置了10種常見的算法,這樣就可以解決很多常見機器學習的問題了。如果用戶有特殊的需求,還可以自己搭建機器學習的算法框架,比如TensorFlow,MXNet,Caffe等。
然後用戶還可以把訓練的數據先放在AWS的簡易內存服務(Simple Storage Service,簡稱S3)。SageMaker會把所有數據處理一遍,然後自己搭建一個數據工作流,彈性塊儲存量,以及其他要素。然後全部處理完之後再把它們拆分開。
這樣,開發者們就可以通過優化烘焙後的超參數來精準微調他們模型的表現。
“以往這些工作都是手動操作的,非常的傷神費時,現在有了AWS省心多了,可以同時測多個參數,再用機器學習來優化這個過程。”Jassy說。
一旦模型訓練好了之後,開發者可以告訴SageMaker他們想用多少個虛擬機器來試跑這套模型。另外,還可以在SageMaker上做A/B測試,讓開發者們直觀地看到他們模型在改動了哪個參數後有更好的表現。
SageMaker能解決哪些開發者們關心的問題
收集和準備數據
選擇和優化機器學習的算法
搭建和管理訓練的環境
訓練和調整模型
開始把模型放進生產流程中
推廣模型的應用以及隨時管理監控
現在這項服務是免費的,不過一旦使用者超過一定的使用限度,就要根據使用頻率和地域來收費了。
除了這款AI雲服務,亞馬遜AWS發布會還推出了4個重磅新工具。
視頻定向追蹤工具Amazon Rekognition Video
能從多個實時的監控流中識別出特定的人,並持續定向跟蹤。這個功能目前已經超過了競爭對手穀歌和微軟。
為了配合這套算法,亞馬遜今天還推出AI驅動的DeepLens攝像頭。根據亞馬遜以往硬件席卷市場的表現,可以預見DeepLens很有可能是亞馬遜下一款殺手級硬件。
雖然穀歌也在兩個月之前推出了一款AI驅動的攝像頭Clips,不過穀歌的這款攝像頭更多的是服務C端消費者,一旦眼前發生有趣的事情,會自動拍照和攝像。而亞馬遜的DeepLens是麵向技術開發人員的。
大概是250刀的DeepLens高清攝像機附帶了預訓練模型,這些模型將使開發人員能夠更輕鬆地開始識別出現在視頻流中的文本字符。 另外,開發人員還可以借助AWS的新SageMaker AI服務來訓練自己的圖像識別模型,然後在相機上運行這些模型。
音頻轉文本係統Amazon Transcribe system
可以把音頻文件中的人類語言直接轉成文本
現在網絡上的音頻內容越來越多,怎麽從音頻中識別檢索提取出特定的信息是個大難題。
亞馬遜今天推出的這個革命性的引擎,能夠把音頻轉換成文本,使得音頻信息也可以被檢索了。
Q:辣音頻轉文本可以用在哪些場景?
好多地方呀,比如以後煲美劇日劇韓劇可以獲得實時字幕,直接就有熟肉看了,不用再辛苦字幕組的小夥伴人肉翻譯了。或者想提高客服中心服務質量的企業,可以不用再花大量的時間挨個聽電話錄音文件了,直接看文字版效率高得多。
不過目前Amazon Transcribe暫時隻支持英文和西班牙語。但亞馬遜官方說啦,未來幾個星期馬上就會推出新的版本,到時會支持更多語種的。
情緒理解服務Amazon Comprehend service
能從文本的用詞、語境、人物描述中識別出背後的積極或消極情緒。目前來說,也是隻支持英語和西班牙語。
首先加的4個功能是,識別語言,名詞分類,情緒分析和關鍵短語提取。這些功能都是為了社交互動功能開發的,響應時間達到百毫秒級別。
Amazon Comprehend目前需要不停地訓練,才能提供更好的自然語言處理服務。亞馬遜的工程師團隊和數據科學家正在不懈努力,擴充和精篩訓練的數據,希望以後大家用起來越來越精準。
最後一個是之前6月份預告過的翻譯工具Amazon Translate
在兩年前收購了Safafa的技術之後,亞馬遜終於推出了自己的語言翻譯服務。不過,這一項服務比穀歌微軟落後了好幾年。
該技術是基於神經網絡中代表的語言配對模型。
該模型由一個編碼和解碼兩部分組成。編碼部分從待翻譯語言中讀取句子,並創建一個目標語言的表達來匹配指定文本的含義。創建了新的表達後,再交給模型的解碼部分,看看生成的表達是不是符合目標語言語料庫中的表述習慣,以及語義有沒有發生偏差。
同時,為了翻譯得盡可能準確又簡練,這個模型中還有一個機製,叫Attention mechanism。隨時留意被翻譯語言文本中的每個單詞,並結合上下文語境,判斷哪些詞是要翻譯成目標語言的,哪些是可以扔掉不要的。
亞馬遜希望這個翻譯工具可以結合其他AWS服務,比如文本轉語音的Polly程序; 用於多語言搜索的Elasticsearch工具; Lex聊天工具; 以及通過Amazon Lambda提供的內容本地化服務。
正如CNBC早些時候報道的那樣 ,這項新服務很可能是基於亞馬遜兩年前購買Safafa的技術。 今天的公告證實了這些早期的報告,並將AWS引入了微軟和穀歌提供的翻譯服務。
據Canalys稱,AWS 在第三季度以31.8%的份額領先雲基礎設施服務市場。 在這個季度,AWS為亞馬遜帶來了45.8億美元的收入和超過10億美元的營業收入 。