Car-tech

Λογισμικό γλώσσας ομιλίας κερδίζει διαγωνισμό Microsoft Dev

Drew Curtis: How I beat a patent troll

Drew Curtis: How I beat a patent troll
Anonim

Λογισμικό μετάφρασης ομιλίας σε νοηματική γλώσσα, που γράφτηκε από ομάδα από την Ταϊλάνδη, κέρδισε την κύρια κατηγορία ενός διαγωνισμού ανάπτυξης λογισμικού για φοιτητές, Κύπελλο, την Πέμπτη

Οι τέσσερις φοιτητές από το Πανεπιστήμιο Kasetsart της Μπανγκόκ κέρδισαν την κατηγορία σχεδιασμού λογισμικού, μπροστά από άλλους έξι φιναλίστ. Δούλεψαν 12 ώρες για έξι μήνες για να ολοκληρώσουν την είσοδό τους, βασιζόμενοι στον αυστηρό προγραμματισμό για να τους οδηγήσουν σε προβλήματα υλικοτεχνικής υποστήριξης που προκλήθηκαν από ταραχές και πολιτική αστάθεια στην πατρίδα τους.

Οι συμμετέχοντες στο Imagine Cup έπρεπε να χρησιμοποιούν πλατφόρμες ανάπτυξης λογισμικού της Microsoft έναν ακόμη ή περισσότερους από τους στόχους της Χιλιετίας των Ηνωμένων Εθνών, οι οποίοι περιλαμβάνουν το ήμισυ της ακραίας φτώχειας, την εξάλειψη της εξάπλωσης του HIV / AIDS και την παροχή καθολικής πρωτοβάθμιας εκπαίδευσης, μέχρι το 2015.

Το πρώτο βραβείο του US $ 25.000 του διαγωνισμού προσέλκυσε συμμετοχές από 325.000 σπουδαστές, σύμφωνα με τη Microsoft. Από αυτά, 400 έκαναν τον τελικό γύρο, ο οποίος προσέφερε συνολικά χρηματικά έπαθλα $ 240.000 σε πέντε κατηγορίες ανταγωνισμού και έξι βραβεία.

Το λογισμικό της ομάδας της Thai, EyeFeel, συνδυάζει την αναγνώριση ομιλίας, την αναγνώριση προσώπου και τη ζωγραφική της γλώσσας υπογραφής "Η μονάδα αναγνώρισης φωνής καταγράφει την ομιλία και μετατρέπει την πρόταση έτσι ώστε να ταιριάζει με τη γραμματική της νοηματικής γλώσσας", ανέφερε ο καπετάνιος της Team Skeek Pichai Sodsai στην IDG News Service. "Στη συνέχεια, η νοηματική γλώσσα κινείται στην οθόνη, ενώ η αναγνώριση προσώπου χρησιμοποιείται για να διακρίνει διαφορετικά ηχεία". Το λογισμικό τοποθετεί επίσης μπαλόνια κειμένου σαν ένα κωμικό βιβλίο, όλα σε πραγματικό χρόνο.

Για να καταστεί βιώσιμο το λογισμικό, η ομάδα χρειάζεται να κάνει αποτελεσματική χρήση των πόρων. "Χρησιμοποιούμε εκτενώς τον κώδικα πολλαπλών θορύβων για να συνδυάσουμε όλα τα μέρη του λογισμικού σε ένα λειτουργικό σύνολο", δήλωσε ο Sodsai. "Κάθε μέρος πρέπει να τρέχει δίπλα στο άλλο. Δεν θα μπορούσε να γίνει χωρίς αυτό."

Ακόμη και τώρα, υπάρχουν ορισμένα θέματα που πρέπει να αντιμετωπίσει η ομάδα. Η γλώσσα υπογλώσσας έχει προβλήματα να συμβαδίζει με την ομιλούμενη γλώσσα και κατά τη διάρκεια της επίδειξης η κινούμενη εικόνα και το γραπτό κείμενο υστερούσαν σημαντικά.

«Είναι τεράστια πρόκληση να αντιμετωπιστεί», δήλωσε ο Sodsai. "Αντιμετωπίζουμε το μεγαλύτερο μέρος του προβλήματος αφήνοντας το λογισμικό να μειώσει αυτόματα την πρόταση". Κάθε πρόταση επαναφέρεται στο βασικό της νόημα, διευκολύνοντας έτσι το λογισμικό να συνεχίσει. Ένας άλλος περιορισμός είναι ότι το λογισμικό υποστηρίζει μόνο αμερικανική νοηματική γλώσσα και αγγλικά. "Η αλλαγή γλώσσας είναι ακόμα ένα τεράστιο έργο", δήλωσε ο Sodsai. "Θα πρέπει να γράψουμε μια ολόκληρη ενότητα γι 'αυτό."

Θα χρειαστούν άλλα μέλη για να τελειοποιήσουν το σύστημα, σύμφωνα με τον Sodsai. Μέχρι τότε, συνεχίζουν να αναζητούν πιθανούς αγοραστές.

"Ο σχεδιασμός είναι πολύ αρθρωτός, έτσι μπορούμε να προσθέσουμε και να αφαιρέσουμε τα χαρακτηριστικά όταν χρειάζεται", δήλωσε. "Σχεδιάζουμε να χρησιμοποιήσουμε ένα σύστημα αδειοδότησης βασισμένο σε ελεύθερα βασικά εξαρτήματα και να πληρώσουμε επιπλέον επιλογές."

Η ομάδα Skeek εκτιμά ότι υπάρχουν περίπου 350 εκατομμύρια άνθρωποι παγκοσμίως με προβλήματα ακοής. Η βασική αγορά θα είναι η εκπαίδευση, όπου το λογισμικό μπορεί να χρησιμοποιηθεί από κωφούς και σχεδόν κωφούς ανθρώπους για να παρακολουθήσουν διαλέξεις και παρουσιάσεις.

Το EyeFeel προερχόταν από μια σερβική ομάδα που ανέπτυξε μια διεπαφή hands-free επικοινωνίας και περιήγησης στο Web για ανθρώπους με σοβαρές μορφές παράλυσης. Τρίτη θέση έλαβε η Νέα Ζηλανδία, με μια εφαρμογή για τη μετατροπή αρχείων σε ήχους που μπορούν να μεταδοθούν σε μεγάλες αποστάσεις χρησιμοποιώντας τις ζώνες FM και AM σε μέρη όπου υπάρχει ελάχιστη ή καθόλου σύνδεση στο Internet. Οι φορητοί υπολογιστές OLPC (One Laptop Per Child) μπορούν να λάβουν τα αρχεία μέσω συνδεδεμένου ραδιοφώνου και να τα μετατρέψουν στην αρχική τους μορφή.

Η ομάδα της Ταϊβάν SmarterME κέρδισε την κατηγορία ανταγωνισμού Embedded Development με έναν μετρητή ισχύος που παρακολουθεί την κατανάλωση ενέργειας από μεμονωμένες συσκευές και οικιακές συσκευές. Η κατηγορία σχεδιασμού παιχνιδιών κέρδισε μια ομάδα από τις Φιλιππίνες

Όχι όλα τα έργα θα έχουν εμπορικό μέλλον, σύμφωνα με τον Jon Perera, Γενικό Διευθυντή της Microsoft Education Group.

"Από την άποψη της πραγματικής εφαρμογής σε παγκόσμιο επίπεδο, κάποιο λογισμικό [μπορεί να] προσγειωθεί στην πραγματική παγκόσμια αγορά και θα έχουν τον αντίκτυπο που οι μαθητές θέλουν να έχουν και, βεβαίως, βλέπουμε πολλά λογισμικά που δεν θα είναι απαραιτήτως εμπορική ή μακροπρόθεσμη βιώσιμη λύση στην αγορά ", ανέφερε. αποτελεί μια αφετηρία για συζητήσεις σχετικά με το ρόλο της τεχνολογίας στην επίλυση προβλημάτων, ανέφερε ο Perera

«Ορισμένες λύσεις χρησιμοποιούνται ήδη από κυβερνήσεις: η ομάδα από την Ιορδανία, για παράδειγμα, δημιούργησε ένα σύστημα παρακολούθησης της απερήμωσης, με ενσωματωμένο ενσωματωμένο πίνακα chipset που παρακολουθεί την ανάπτυξη της ερήμου με την πάροδο του χρόνου », είπε. "Η κυβέρνηση της Ιορδανίας συνεργάζεται μαζί τους και υποστηρίζει την ομάδα να έχει εντοπιστεί αρκετές τοποθεσίες."