Με αφορμή τα 20 χρόνια λειτουργείας του Ξενώνα Προσωρινής Διαμονής, η Εταιρία Προστασίας Σπαστικών/ Πόρτα Ανοιχτή βράβευσε την bwin για την πολύπλευρη στήριξη της.
Εφαρμογή της Google «διαβάζει» σε ποιο μέρος της Γης τραβήχτηκε μια φωτογραφία
Εφαρμογή της Google «διαβάζει» σε ποιο μέρος της Γης τραβήχτηκε μια φωτογραφία
Οι ερευνητές, με επικεφαλής τον Τομπάιας Γουέιαντ, ανέπτυξαν ένα λογισμικό «βαθιάς μάθησης», το οποίο κάνει γεωεντοπισμό της φωτογραφίας, χρησιμοποιώντας μόνο πληροφορίες από τα εικονοστιχεία (πίξελ) της
Ωραία είναι αυτή η φωτογραφία, αλλά που στο καλό τραβήχτηκε; Σε αυτό το συχνό ερώτημα, που οι άνθρωποι δυσκολεύονται να απαντήσουν, μια νέα εφαρμογή, την οποία δημιούργησαν τρεις ερευνητές της Google, τα καταφέρνει πολύ καλύτερα, «διαβάζοντας» πιο σωστά το τοπίο. Η εφαρμογή βρίσκεται ακόμη σε στάδιο ανάπτυξης και δεν έχει κυκλοφορήσει προς χρήση.
Οι ερευνητές, με επικεφαλής τον Τομπάιας Γουέιαντ, ανέπτυξαν ένα λογισμικό «βαθιάς μάθησης», το οποίο κάνει γεωεντοπισμό της φωτογραφίας, χρησιμοποιώντας μόνο πληροφορίες από τα εικονοστιχεία (πίξελ) της.
Εκ πρώτης όψεως φαντάζει δύσκολο έως αδύνατο να καταλάβει κανείς που τραβήχτηκε μια φωτογραφία, χωρίς να έχει άλλες πληροφορίες πέρα από την ίδια την εικόνα. Μερικές φορές οι άνθρωποι χρησιμοποιούν ενδείξεις, όπως ο καιρός, τα φυτά, διάφορα αντικείμενα κ.α. που φαίνονται στη φωτογραφία, για να βγάλουν συμπεράσματα - άλλες φορές με επιτυχία και άλλες όχι. Υπάρχουν και σχετικοί διαδικτυακοί τόποι όπως το GeoGuessr και το View from your Window, όπου οι χρήστες δοκιμάζουν τις ικανότητές τους.
Οι ερευνητές ακολούθησαν μια τελείως διαφορετική μέθοδο υπολογιστικής όρασης. Τοποθέτησαν ένα πλέγμα πάνω σε ένα ψηφιακό κόσμο, χωρίζοντας έτσι την επιφάνεια του πλανήτη σε χιλιάδες τετραγωνάκια διαφορετικών μεγεθών, ανάλογα με το πόσες φωτογραφίες τραβιούνται στην πραγματικότητα (π.χ. σε μια πόλη όπως η Νέα Υόρκη τραβιούνται πολύ περισσότερες φωτογραφίες από ό,τι σε μια έρημο, άρα το τετραγωνάκι της μεγαλούπολης είναι μεγαλύτερο).
Στη συνέχεια, τροφοδότησαν το λογισμικό τους με εκατομμύρια αποθηκευμένες φωτογραφίες, που συνοδεύονταν από πληροφορίες γεωεντοπισμού. Ακολούθως, το πρόγραμμα, που διαθέτει νευρωνική νοημοσύνη, δημιούργησε συσχετίσεις και αντιστοιχίες ανάμεσα στα πίξελ των εικόνων και στα τα μέρη όπου τραβήχτηκαν οι φωτογραφίες.
Τελικά, η εφαρμογή δοκιμάσθηκε με 2,3 εκατομμύρια φωτογραφίες από το Flickr. Όπως διαπιστώθηκε, κατάφερε να «πέσει μέσα» σε ποσοστό 48% όσον αφορά την ήπειρο που τραβήχτηκε μια φωτογραφία, 28,4% όσον αφορά τη συγκεκριμένη χώρα, 10,1% για την πόλη όπου έγινε η λήψη της φωτογραφίας και 3,6% για τον συγκεκριμένο δρόμο της πόλης.
Οι ερευνητές, με επικεφαλής τον Τομπάιας Γουέιαντ, ανέπτυξαν ένα λογισμικό «βαθιάς μάθησης», το οποίο κάνει γεωεντοπισμό της φωτογραφίας, χρησιμοποιώντας μόνο πληροφορίες από τα εικονοστιχεία (πίξελ) της.
Εκ πρώτης όψεως φαντάζει δύσκολο έως αδύνατο να καταλάβει κανείς που τραβήχτηκε μια φωτογραφία, χωρίς να έχει άλλες πληροφορίες πέρα από την ίδια την εικόνα. Μερικές φορές οι άνθρωποι χρησιμοποιούν ενδείξεις, όπως ο καιρός, τα φυτά, διάφορα αντικείμενα κ.α. που φαίνονται στη φωτογραφία, για να βγάλουν συμπεράσματα - άλλες φορές με επιτυχία και άλλες όχι. Υπάρχουν και σχετικοί διαδικτυακοί τόποι όπως το GeoGuessr και το View from your Window, όπου οι χρήστες δοκιμάζουν τις ικανότητές τους.
Οι ερευνητές ακολούθησαν μια τελείως διαφορετική μέθοδο υπολογιστικής όρασης. Τοποθέτησαν ένα πλέγμα πάνω σε ένα ψηφιακό κόσμο, χωρίζοντας έτσι την επιφάνεια του πλανήτη σε χιλιάδες τετραγωνάκια διαφορετικών μεγεθών, ανάλογα με το πόσες φωτογραφίες τραβιούνται στην πραγματικότητα (π.χ. σε μια πόλη όπως η Νέα Υόρκη τραβιούνται πολύ περισσότερες φωτογραφίες από ό,τι σε μια έρημο, άρα το τετραγωνάκι της μεγαλούπολης είναι μεγαλύτερο).
Στη συνέχεια, τροφοδότησαν το λογισμικό τους με εκατομμύρια αποθηκευμένες φωτογραφίες, που συνοδεύονταν από πληροφορίες γεωεντοπισμού. Ακολούθως, το πρόγραμμα, που διαθέτει νευρωνική νοημοσύνη, δημιούργησε συσχετίσεις και αντιστοιχίες ανάμεσα στα πίξελ των εικόνων και στα τα μέρη όπου τραβήχτηκαν οι φωτογραφίες.
Τελικά, η εφαρμογή δοκιμάσθηκε με 2,3 εκατομμύρια φωτογραφίες από το Flickr. Όπως διαπιστώθηκε, κατάφερε να «πέσει μέσα» σε ποσοστό 48% όσον αφορά την ήπειρο που τραβήχτηκε μια φωτογραφία, 28,4% όσον αφορά τη συγκεκριμένη χώρα, 10,1% για την πόλη όπου έγινε η λήψη της φωτογραφίας και 3,6% για τον συγκεκριμένο δρόμο της πόλης.
Ίσως τα ποσοστά αυτά να μην φαίνονται εντυπωσιακά, αλλά ένας άνθρωπος δεν μπορεί να τα καταφέρει τόσο καλά, όταν βλέπει μια φωτογραφία που έχει τραβηχτεί κάπου στη Γη. Αυτό αποδείχθηκε, όταν οι τρεις ερευνητές αντιπαράθεσαν την εφαρμογή τους με τις επιδόσεις δέκα ανθρώπων σε ένα πείραμα.
Το επόμενο βήμα για τη βελτίωση της εφαρμογής θα είναι η ενσωμάτωση της ικανότητας να αναγνωρίζει αντικείμενα και άλλα γνωρίσματα (χρώμα δέρματος ανθρώπων, αρχιτεκτονική κτιρίων, είδος δέντρων, πινακίδες οδικής κυκλοφορίας κ.α.) και να τα συσχετίζει με συγκεκριμένες τοποθεσίες.
Το επόμενο βήμα για τη βελτίωση της εφαρμογής θα είναι η ενσωμάτωση της ικανότητας να αναγνωρίζει αντικείμενα και άλλα γνωρίσματα (χρώμα δέρματος ανθρώπων, αρχιτεκτονική κτιρίων, είδος δέντρων, πινακίδες οδικής κυκλοφορίας κ.α.) και να τα συσχετίζει με συγκεκριμένες τοποθεσίες.
Ακολουθήστε το protothema.gr στο Google News και μάθετε πρώτοι όλες τις ειδήσεις
Δείτε όλες τις τελευταίες Ειδήσεις από την Ελλάδα και τον Κόσμο, τη στιγμή που συμβαίνουν, στο Protothema.gr
Δείτε όλες τις τελευταίες Ειδήσεις από την Ελλάδα και τον Κόσμο, τη στιγμή που συμβαίνουν, στο Protothema.gr
ΡΟΗ ΕΙΔΗΣΕΩΝ
Ειδήσεις
Δημοφιλή
Σχολιασμένα