Car-tech

Web Apps

GGJ 2020 Keynote and Theme

GGJ 2020 Keynote and Theme
Anonim

και τις επιτυχίες της Apple στην αγορά των smartphone, η Microsoft σχεδιάζει να χρησιμοποιήσει τεχνολογία επεξεργασίας φωνής βασισμένη σε σύννεφο και τεχνολογία επεξεργασίας φυσικών γλωσσών για να προσφέρει δυνατότητες διεπαφών χρήστη που δεν βρίσκονται στις συσκευές iPhone ή Android

«Πιστεύουμε ότι ο λόγος δεν είναι ξεχωριστή εφαρμογή. αποτελεί αναπόσπαστο μέρος της εμπειρίας των χρηστών ", δήλωσε ο Zig Serafin, γενικός διευθυντής ενοποιημένων επικοινωνιών της Microsoft, ενώπιον ακροατηρίου στο συνέδριο SpeechTEK 2010, που πραγματοποιήθηκε αυτή τη βδομάδα στη Νέα Υόρκη.

Προκειμένου να ενισχυθούν οι δυνατότητες των Windows Phone 7 για την κατανόηση μιας φωνητικής εντολής και την επίτευξη του ζητούμενου αποτελέσματος, η εταιρεία σχεδιάζει να συνδέσει τα Windows Phone 7 με τη φωνητική αναγνώριση Tellme της εταιρείας και την υπηρεσία επεξεργασίας φυσικής γλώσσας της εταιρείας, δήλωσε ο Se rafin, σε μια επόμενη συνέντευξη με την IDG News Service.

[Περαιτέρω ανάγνωση: Τα καλύτερα τηλέφωνα Android για κάθε προϋπολογισμό.]

Η Microsoft αγόρασε την εταιρεία που δημιούργησε αυτήν την υπηρεσία Tellme Networks το 2007.

Πριν από το κοινό SpeechTEK, ο Serafin τιμωρούσε τα λειτουργικά συστήματα Android και iPhone για χρήση των εικονιδίων ως κύρια μορφή αλληλεπίδρασης. «Τα περισσότερα smartphones είναι ένα πλέγμα εικόνων, όπως τα Windows 3.1», είπε.

Το να μιλάς στο τηλέφωνο είναι ένας πιο φυσικός τρόπος να του πεις τι να κάνεις, είπε. "Όταν μετακομίζετε σε μια συσκευή που δεν διαθέτει ένα μεγάλο πληκτρολόγιο, η φωνή είναι ένα τόσο συναρπαστικό συμπλήρωμα αυτής της εμπειρίας", δήλωσε ο Serafin.

Στη συνέχεια, ο διευθυντής μάρκετινγκ της Microsoft, Ilya Bukshteyn, διεξήγαγε μια επίδειξη για το πώς ένα Windows Phone 7 θα μπορούσε να χρησιμοποιήσει την αναγνώριση ομιλίας και την επεξεργασία της φυσικής γλώσσας ή τα μέσα με τα οποία ένας υπολογιστής ερμηνεύει τι λέει ένα άτομο. Ο Bukshteyn ζήτησε από το τηλέφωνο να καλέσει "Paul", και μια φωνή που εκπέμπει από την ακουστική απάντησε με μια σειρά διαφορετικών επαφών με το όνομα Paul. Ο Bukshteyn απάντησε με το συγκεκριμένο πλήρες όνομα και το τηλέφωνο προχώρησε να καλέσει εκείνο το άτομο.

Η Bukshteyn είπε επίσης στο τηλέφωνο να ανοίξει ένα άλμπουμ φωτογραφιών και μια εφαρμογή προβολής εικόνων ήρθε στην οθόνη, δείχνοντας όχι μόνο εικόνες που τραβούσε ο χρήστης, αλλά και από τους φίλους του χρήστη που δημοσιεύθηκαν σε ιστότοπους κοινωνικής δικτύωσης.

Σε ένα τρίτο παράδειγμα, ο Bukshteyn ζήτησε μια λίστα με κοντινά κινεζικά εστιατόρια. Το αίτημα μεταφέρθηκε στην υπηρεσία αναζήτησης Bing, η οποία επέστρεψε μια λίστα με τα εστιατόρια και τις τοποθεσίες τους σε ένα χάρτη.

Ενώ το iPhone και οι παραλλαγές του Android χρησιμοποιούν κάποιες δυνατότητες αναγνώρισης φωνής, η τηλεφωνική υπηρεσία της Microsoft θα είναι διαφορετική σε αριθμό σέβεται, είπε ο Σέραφιν. Για ένα, δεν θα περιορίζεται στη χρήση σε μερικές μόνο εφαρμογές, αλλά θα μπορούσε να χρησιμοποιηθεί για τον έλεγχο ολόκληρου του τηλεφώνου. Ο δεύτερος τρόπος με τον οποίο η υπηρεσία αυτή θα είναι μοναδική είναι ότι θα είναι διαδραστική. Εάν η διεύθυνσή σας είναι διφορούμενη, το ακουστικό ή η κατάλληλη υπηρεσία μπορεί να ζητήσει από τον χρήστη να διασαφηνίσει το αίτημα.

Η συνιστώσα ομιλίας είναι ένα μέρος αυτού που η Serafin ονομάζεται "φυσικό περιβάλλον χρήστη" ή NUI. Το NUI βασίζεται στη φωνή, την αφή και ακόμα και την κίνηση ως μορφές εισόδου.

«Η ομιλία είναι ο πυρήνας της NUI», είπε. Μέρος της επίδειξης έδειξε πώς η τεχνολογία Kinnect XBox της Microsoft θα μπορούσε να ερμηνεύσει χειρονομίες για να ενεργοποιήσει τις ενέργειες στον υπολογιστή. Η τεχνολογία αυτή θα χρησιμοποιηθεί σε προϊόντα της Microsoft πέρα ​​από το XBox, δήλωσε ο Bukshteyn σε μια επόμενη συνέντευξη με την IDG.

Η Serafin ανέφερε ότι η εταιρεία βρίσκεται στις πρώτες διαδικασίες της διαδοχικής αλληλεπίδρασης ομιλίας σε διαφορετικά στοιχεία του Windows Phone 7, χρησιμοποιήστε - αναζήτηση, κλήση ατόμων και καθοδήγηση χρηστών σε συλλογές φωτογραφιών.

Ένας χρήστης μπορεί να ενεργοποιήσει το τηλέφωνο για να ακούει φωνητικές εντολές κρατώντας πατημένο ένα μόνο κουμπί στο τηλέφωνο. Ορισμένες από τις επεξεργασίες γλωσσών θα πραγματοποιηθούν τηλεφωνικά και ορισμένες θα γίνουν από τον Tellme. "Ειλικρινά, ο χρήστης δεν πρέπει να γνωρίζει ή να νοιάζεται" για το πού επεξεργάζονται οι φωνητικές εντολές, δήλωσε ο Bukshteyn.

Η Serafin ισχυρίστηκε ότι η υπηρεσία Tellme είναι το μεγαλύτερο χρησιμοποιούμενο σύστημα επεξεργασίας φυσικής γλώσσας βασισμένο σε λόγια που χρησιμοποιείται σήμερα. Η Microsoft τοποθετεί την υπηρεσία σε μεγάλους οργανισμούς για υποστήριξη τηλεφωνικής υποστήριξης. Ο τομέας εξυπηρέτησης άνω των 2,5 δισεκατομμυρίων τηλεφώνων απευθύνεται κάθε χρόνο στους εταιρικούς πελάτες.

Ο Joab Jackson καλύπτει το λογισμικό επιχειρήσεων και γενικές τεχνολογικές εξελίξεις για το Η υπηρεσία ειδήσεων IDG. Ακολουθήστε τον Joab στο Twitter στο @Joab_Jackson. Η διεύθυνση ηλεκτρονικού ταχυδρομείου του Joab είναι [email protected]