2011年9月28日星期三

美科技博客揭秘iPhone 5:語音轉文本技術值得期待

    導語:美國科技博客9to5mac周一發表文章稱,蘋果將于10月4日發布新一代iPhone手機,新手機採用雙核A5處理器、1GB RAM、800萬像素攝像頭,支持“助理”語音導航功能和Nuance語音轉文本技術等,絕對是一款值得期待的產品。
  以下為文章內容摘要:

  攤牌時刻
  拆開新一代iPhone包裝盒會發現,新手機與iPhone 4相比有重大更新,它採用iPad 2使用的雙核A5處理器,支持更高的性能、更佳的遊戲體驗,以及大幅提升的圖形性能。不僅如此,來自業內的知情人士還稱,新一代iPhone採用1GB RAM,這不僅意味著可支持更流暢的Web瀏覽體驗,更重要的是,新一代iPhone係統中的新後臺任務將會得到更好的運行。
  蘋果還對新一代iPhone的攝像頭進行了升級,在硬件方面,新的後置攝像頭採用800萬像素傳感器,支持更高的分辨率。由于配備了背光傳感器,因此在低光照條件下也能拍攝出高質量的照片。此外,iOS的軟件開發工具包(SDK)中還包含了全景拍照的參考資料,這意味著新一代iPhone很可能支持該功能。至于前置攝像頭,據說沒有太大變化。
  新一代iPhone採用高通的Gobi基帶,同時支持GSM和CDMA網絡。至于蘋果是否在開發一個虛擬的SIM卡係統,或是否內置NFC(近場通信)芯片,目前還無法確定。

  “助理”是最大賣點
  相信很多人會對新一代iPhone的內部硬件升級感到興奮,但新設備的最大賣點卻是一項被稱為“助理”(Assistant)的軟件功能。正如此前所述,“助理”是一套係統級語音導航係統。遺憾的是,iPhone 4和iPhone 3GS似乎並不支持該功能,因為它需要A5處理器和更高的內存支持。
  據我們所知,今年即將推出的新一代iPhone的最大賣點就是這個基于Siri技術的“助理”功能,該係統是蘋果2009年推出的iPhone 3GS的”語音控制”(Voice Control)功能演變而來,同時還得益于蘋果去年收購的Siri。

  “助理”的工作原理
  要激活“助理”功能,用戶只要按住Home鍵2-3秒即可(得益于A5處理器和更大的內存,該功能啟動速度快于“語音控制”),然後麥克風界面就會從屏幕底部動態滑出。語音輸入界面並非全屏,用戶在鎖屏狀態下仍可使用該功能。
  之前的“語音控制”的直接命令寥寥無幾,因此蘋果通過波形(waveform)形式滑出命令選項。而“助理”則支持無限種可能,因此蘋果採取了一個小的“信息”(info)按鈕,用戶點擊後可瀏覽一些常用的語音命令。在該界面下,蘋果不僅提供了命令的類型,還提供了一些例句。很明顯,蘋果希望這一切能直觀地展現給用戶。在“助理”界面的中部有一個帶著紫色光暈的銀色麥克風圖標,紫色的光暈意味著iPhone已進入語音命令接收狀態。
  知情人士稱,“助理”功能深入到iPhone的諸多方面。例如,用戶可以說“下午7點30分與馬克‧古爾曼(Mark Gurman)見個面”,然後”助理“就會在用戶的日歷中創建一個日程安排。在日常安排提醒方面,“助理”還允許用戶利用iOS 5中的Reminders應用。例如,用戶可以說“到市場後提醒我買牛奶”、“到斯臺普斯體育館(Staples Center)怎麼走?”等等。此時,“助理”將會利用GPS為用戶定位,並提供方向。

  “助理”的其他功能
  “助理”還擁有另一個有趣的功能,根據用戶的語音命令編寫和發送短信或iMessage。例如,用戶可以說“給馬克發條短信,說我午餐會晚點去”,之後短信就會自動發送。
  對于無法打字或沒有時間打字的用戶而言,是一項極具吸引力的功能。用戶還可以讓“助理”反復閱讀尚未發送的信息,以確保短信的正確性。如果正確,用戶只需說“是”(Yes)即可發送。如果不正確,用戶可以說“不”(No),然後“助理”會讓用戶再說一次短信內容。此外,蘋果還在努力允許用戶通過語音讓“助理”播放制定音樂曲目。而之前的“語音控制”只允許用戶通過語音選擇專輯、歌手和播放列表進行播放。
  “助理”的一個核心元素是會話視圖(conversation view),係統會反復閱讀,讓用戶獲得更多的信息,從而提供更好的結果。從本質上而言,用戶可以把iPhone當作另一個真人與其對話。例如,如果用戶想開會,對著手機說“約見馬克”,係統會彈出第一個氣泡狀對話框。然後係統會問:“使用哪個電子郵箱的地址?工作郵箱還是個人郵箱?”在詢問該問題的同時,iPhone“助理”會以語音形式發出聲音,同時還會彈出氣泡對話框。用戶提供電子郵箱地址後,預約即大功告成。此時iPhone還會在日歷中顯示快速視圖,以確認預約完成。再舉一個例子,如果用戶利用“助理”發短信,會顯示一個微型短信界面,用戶可快速瀏覽短信會話。
  知情人士稱,“助理”的語音識別能力極強,用戶的發音甚至無需太清晰,語速也無需很慢。用戶可以向與普通人說話那樣與“助理”對話。
  “助理”的另一個令人關注的功能是“尋找好友”(Find my Friends)。例如,如果想知道好友在哪裏,用戶可以對著手機說“馬克在哪兒?”,然後”助理“就會啟動GPS定位,並共享位置信息。當然,用戶可對該過程進行隱私設定。
  另外,“助理”的一個最酷功能可能莫過于整合Wolfram Alpha。Wolfram Alpha是一個在線自動問答係統,相當于可以直接返回結果的搜索引擎。與Wolfram Alpha整合後,用戶可以向iPhone咨詢各種各樣的問題,然後立刻獲得答案。例如,可以問iPhone一道數學題,如“12.75米等于多少英尺”等。毫無疑問,這樣的功能十分強大,將為用戶提供極大方便。

  整合語音轉文本技術
  來自移動運營商的消息還稱,除了“助理”,新一代iPhone還將整合Nuance語音轉文本(speech-to-text)技術。用戶點擊麥克風圖標,對著手機說話,即可將語音轉換成文字。通常,該轉換過程只需不到一秒鐘,且準確度相當高。有報道稱,該功能的界面簡潔直觀,並將融入到iOS 5的信息(Messages)應用設計中。
  再回頭說說硬件設計,目前基本可以確定的是下一代iPhone在設計上基本與iPhone 4一致。此前曾有報道稱,蘋果為避免新產品泄漏,直接將下一代iPhone內部硬件塞進 iPhone 4外殼裏。當然,也有報道根據近期泄露的所謂的iPhone 5外殼稱下一代iPhone在新設計上有所更新。
  不管怎樣,“助理”功能、1GB RAM、雙核A5處理器、Nuance語音轉文本技術和800萬像素攝像頭等等,這些都使得即將于10月4日發布的新一代iPhone手機值得期待。(李明)

沒有留言:

發佈留言