Τεχνολογία

Eshop βασισμένο πάνω στο μοντέλο της Μηχανικής Μάθησης

Ένα βήμα προς την αναζήτηση βάσει εικόνας με βαθιά μηχανική μάθηση μοντέλα και αλγορίθμοι που επιτρέπουν στους υπολογιστές να μαθαίνουν από σύνθετα δεδομένα με αποτέλεσμα το ηλεκτρονικό εμπόριο να γινεται εύκολο και για τον ιδιοκτήτη και τον καταναλωτή.

Βαθιά συνελικτικά νευρωνικά δίκτυα, ανατροφοδοτούμενα νευρωνικά δίκτυα, στοχαστικοί αλγορίθμοι εκπαίδευσης από σύνολα δεδομένων μεγάλης κλίμακας.

Η ATG Digital Greece παρακολουθεί τις εξελίξεις με συνεργασίες σε Ελλαδα και Εξωτερικό και δοκιμάζει την βαθιά εκμάθηση και τους αυτοματισμούς σε καταστήματα eSHOP που κατασκευάζει με αποτέλεσμα να γινονται καλύτερα και στην Ελλαδα και στην παγκόσμια αγορά . 

Κολλημένοι στο παρελθόν?

Η δημιουργία και η συντήρηση μιας εταιρείας ηλεκτρονικού εμπορίου γίνεται ευκολότερη κάθε μέρα χάρη στην τρέχουσα ευκολία αγοράς και πώλησης προϊόντων από και προς οπουδήποτε στον κόσμο, αλλά και στον εκδημοκρατισμό των τεχνολογιών που επιτρέπουν σε έναν επιχειρηματία να μεταβεί από το μηδέν σε μια λύση εργασίας σε λίγες μέρες αν όχι ώρες.

Επιπλέον, οι υπάρχουσες επωνυμίες μόδας μετεγκαθίστανται και δημιουργούν τα δικά τους διαδικτυακά καταστήματα, καθώς οι πελάτες ξοδεύουν όλο και περισσότερο χρόνο στο διαδίκτυο και δημιουργούν έτσι την ευκαιρία να χρησιμοποιούν κοινωνικά δίκτυα και εφαρμογές για συνεχή σύνδεση με αυτά και να πραγματοποιούν μάρκετινγκ μεμονωμένες καμπάνιες με περιεχόμενο προσανατολισμένο στον χρήστη.

Ωστόσο, κατά την ανάλυση του τρόπου με τον οποίο αυτές οι πλατφόρμες επιτρέπουν στους χρήστες να αναζητούν είδη μόδας στους καταλόγους τους, είναι δυνατό να συνειδητοποιήσουμε ότι εξακολουθεί να είναι πρωτόγονη εργασία με τους περισσότερους ιστότοπους να υποστηρίζουν μόνο βασικά ερωτήματα βάσει κειμένου.

Ενώ μερικές φορές η περιγραφή ενός προϊόντος είναι εύκολη υπόθεση, όταν βλέπεις ένα πουκάμισο με ένα ιδιαίτερο μοτίβο ή μια καινοτόμο υφή, το μεταφράζεις σε λέξεις, μπορεί να οδηγήσει σε μια απογοητευτική λειτουργία που θα οδηγήσει τον πελάτη να σταματήσει και κατά συνέπεια να μειώσει το ποσοστό μετατροπής ενός καταστήματος.

Ίσως σκέφτεστε ότι αυτό δεν είναι ένα νέο πρόβλημα και η αλήθεια είναι ότι δεν είναι, ωστόσο, όταν σκέφτεστε πώς έχει αντιμετωπιστεί, θα καταλήξετε είτε να μελετήσετε πώς να αποθηκεύσετε μη αυτόματους σχολιασμούς που σχετίζονται με μια εικόνα (η οποία μπορεί να διαρκέσει αιώνες σε μεγάλα σύνολα δεδομένων) ή πώς να εφαρμόσετε έναν περιγραφέα εικόνας όπως Swift, Hog, Colour συσχετίσεις, Linear Binary Patterns και πολλά άλλα (Μην ανησυχείτε αν γνωρίζετε κάτι που μας φέρνει στο μυαλό μου) που στις περισσότερες περιπτώσεις απαιτούν ειδικούς.

Κάντε την εφαρμογή και ερμηνεύστε τα αποτελέσματα, καθώς δεν είναι εκπαιδευτικά, που σημαίνει ότι δεν θα γίνουν καλύτερα να περιγράφουν τις εικόνες σας καθώς εισάγετε όλο και περισσότερες από αυτές.

Η λύση για να γίνει πιο αποτελεσματική εκμάθηση οπτικών χαρακτηριστικών για τις εικόνες σας θα ήταν να αναπτύξετε έναν αυτοματοποιημένο τρόπο εκμάθησης οπτικών χαρακτηριστικών από εικόνες και η βαθιά μάθηση είναι μια πιθανή λύση.

Αλλά τι είναι η βαθιά μάθηση;

Η βαθιά μάθηση είναι ένας κλάδος της μηχανικής μάθησης που χρησιμοποιεί προσεγγίσεις τεχνητών νευρικών δικτύων για εκμάθηση αναπαραστάσεων δεδομένων που μπορούν στη συνέχεια να εφαρμοστούν σε πολλές διαφορετικές λύσεις προβλημάτων που εχει δώσει η ATG Digital Greece  σε πολλα ηλεκτρονικά καταστήματα.

Αποτελείται από πολλαπλά επίπεδα τοποθετημένα διαδοχικά για συνεχή βαθύτερα μαθήματα σχετικά με μια εικόνα εισόδου. Στο τέλος της μαθησιακής διαδικασίας, δημιουργεί μια ιεραρχική δομή αναπαράστασης δεδομένων από χαρακτηριστικά χαμηλού έως υψηλού επιπέδου (Όσο υψηλότερο είναι το μοντέλο που περιγράφεται λεπτομερώς στη μάθηση – μια καμπύλη γραμμή μπορεί να είναι ένα χαμηλό χαρακτηριστικό σε αντίθεση με ένα αυτί ή ένα μάτι που είναι ένα χαρακτηριστικό υψηλού επιπέδου).

Ανάλογα με τον τύπο των επιπέδων που αποτελείται από ένα μοντέλο βαθιάς μάθησης μπορεί να χρησιμοποιηθεί για πολλαπλούς σκοπούς. Ένα παράδειγμα αυτού είναι τα λεγόμενα βαθιά συνελικτικά νευρικά δίκτυα που έχουν επιφέρει βελτιώσεις στην επεξεργασία εικόνων, βίντεο, ομιλίας και εκμάθησης ήχου.

Σε αντίθεση με τα παραδοσιακά συστήματα ανάκτησης εικόνων, χρησιμοποιεί εκπαιδευτικά προγράμματα εξαγωγής χαρακτηριστικών. Όσο περισσότερες εικόνες εισάγουμε σε έναν συγκεκριμένο μαθητή, τόσο πιο σχετικές θα είναι οι οπτικές δυνατότητες.

Η βαθιά μάθηση είναι ένα πολύ μοντέρνο θέμα τώρα, δείχνοντας υψηλή ακρίβεια στο πλαίσιο που βασίζεται στην εικόνα, το οποίο μπορεί να μεταβεί από τμηματοποίηση εικόνας σε ανίχνευση αντικειμένων και ανάκτηση εικόνας. από αυτό, πολλοί ερευνητές και εταιρείες έχουν οικοδομήσει και μοιράζονται στην κοινότητα, συμπεριλαμβανομένων προ-εκπαιδευμένων συνελικτικών νευρωνικών δικτύων, διαθέσιμης δημόσιας χρήσης.

Πώς εκπαιδεύονται;

Δείτε πότε υποβάλλετε ερωτήσεις σε ένα παιδί τριών ετών όπως

“Ποιος είναι αυτός ο άντρας;”

ή

“Τι χρώμα είναι αυτό το κουτάλι;”

και η απάντησή του μπορεί να είναι τόσο τυχαία όσο η ανατροπή ενός νομίσματος;

Αυτό ακριβώς είναι το μοντέλο βαθιάς μάθησης σε πρώιμο στάδιο.

Εικόνα ενός συνόλου βαρών που επηρεάζουν μια συνάρτηση ενεργοποίησης, που σημαίνει ότι όσο υψηλότερο είναι το βάρος τόσο περισσότερο ενεργοποιείται η λειτουργία και όσο χαμηλότερη τόσο μικρότερη. Όταν διορθώσετε το τρίχρονο παιδί και του πείτε τη σωστή απάντηση, τα βάρη για τη λειτουργία ενεργοποίησης της απάντησής του σε αυτήν την ερώτηση θα προσαρμοστούν. Αν ήταν σωστός, τα βάρη θα παραμείνουν έτσι, αν έκανε λάθος, τα βάρη θα μειωθούν. Όταν μιλάμε για μεθόδους βαθιάς μάθησης, λειτουργούν με τον ίδιο τρόπο. Όσο περισσότερες εικόνες δίνετε, με εποπτευόμενο τρόπο, τόσο περισσότερο θα μαθαίνει βέλτιστα βάρη για την καλύτερη ενεργοποίηση των λειτουργιών ενεργοποίησής του.

Δεν υπάρχουν μυστικά εδώ, όσο περισσότερο βλέπει, τόσο καλύτερα γίνεται. Ορισμένες παρατηρήσεις που χρειάζεται για να απαντήσουν με ακρίβεια στο πρόβλημά σας εξαρτώνται από την πολυπλοκότητα του εύρους λύσεων και φυσικά από τα επίπεδα αποδοχής της ακρίβειας.

Όταν μιλάμε για πλατφόρμες αναζήτησης με βάση την εικόνα, δεν ενδιαφερόμαστε να χρησιμοποιήσουμε τη βαθιά μάθηση για την ταξινόμηση ομοιότητας (Αν και θα μπορούσαμε), αλλά μάλλον τη χρήση αυτής της τεχνικής για εκμάθηση χαρακτηριστικών και εξαγωγή.

Το χρησιμοποιεί κάποιος;

Το οπτικό εργαλείο σελιδοδείκτη Pinterest αποφάσισε να επενδύσει στην εκμάθηση οπτικών χαρακτηριστικών που θα μπορούσαν να επιτρέψουν τις προτάσεις βάσει των οπτικών προτιμήσεων του χρήστη.

Ανέπτυξαν ένα πρωτότυπο μιας μηχανής οπτικής αναζήτησης, που χρησιμοποιεί βαθιά συνελικτικά νευρικά δίκτυα, για να επιτρέψει στους χρήστες να κάνουν κλικ σε αντικείμενα που επισημαίνονται αυτόματα, όπως τσάντες και παπούτσια, για να βλέπουν παρόμοια προϊόντα σε άλλες καρφίτσες χρησιμοποιώντας εικόνες και επιμελημένες πληροφορίες σχετικά με τα προϊόντα, καθιστώντας αυτό ένα σημασιολογικό σύστημα ανάκτησης εικόνας.

Η προτεινόμενη αρχιτεκτονική του Pinterest καλύπτει όχι μόνο το πρόβλημα της οπτικής αναζήτησης, αλλά και την ανίχνευση αντικειμένων και τη θέση που σχετίζονται με την ανάκτηση εικόνων.

Για αυτήν την εργασία μελετήθηκε μόνο η οπτική ομοιότητα και για αυτήν τη διαδικασία χρησιμοποιούσε ένα συνελικτικό νευρικό δίκτυο για να εξαγάγει και να κωδικοποιήσει διανύσματα οπτικών χαρακτηριστικών από εικόνες και, τέλος, να εφαρμόσει μια μέτρηση απόστασης για να υπολογίσει παρόμοια οπτικά.

Ενώ αναπτύσσει το σύστημά τους, η Pinterest κατέληξε στο συμπέρασμα ότι η πλήρης εκπαίδευσή της για να μάθει μια καλή αναπαράσταση μπορεί να είναι χρονοβόρα και απαιτεί ένα πολύ μεγάλο σύνολο προπόνησης.

Με αυτόν τον τρόπο αποφάσισαν να χρησιμοποιήσουν ένα προ-εκπαιδευμένο convnet, διαθέσιμο στο διαδίκτυο, από το οποίο διατηρούν χαρακτηριστικά χαμηλού επιπέδου που εξάγονται από διαφορετικά βάθη του δικτύου.

Είναι ενδιαφέρον να αναφέρουμε ότι τον Μάρτιο του 2017 η Samsung κυκλοφόρησε το νέο smartphone Galaxy S8 που ενσωματώνει έναν βοηθό που βασίζεται σε AI που ονομάζεται Bixby.

Αυτός ο βοηθός έρχεται με μια μηχανή οπτικής αναζήτησης που χρησιμοποιεί την αρχιτεκτονική Pinterest και την έρευνα σε συστήματα ανάκτησης με βάση την εικόνα.

Πώς μοιάζει η αρχιτεκτονική ενός συστήματος αναζήτησης με βάση την εικόνα;

Αλγοριθμικά μιλώντας, για να χτίσουμε ένα σύστημα όπως αυτό που έκανε το Pinterest, μια πιθανή αρχιτεκτονική θα μπορούσε να είναι η ακόλουθη.

Πρώτα απ ‘όλα πρέπει να εξαγάγετε οπτικά χαρακτηριστικά από τα εκπαιδευτικά δεδομένα (κατάλογος αναζήτησης) χρησιμοποιώντας ένα προ-εκπαιδευμένο συνελικτικό νευρωνικό δίκτυο, που σημαίνει

(1) εικόνες προ-επεξεργασίας έτσι ώστε όλες να έχουν το ίδιο μέγεθος

(2) να εξαγάγετε οπτικά χαρακτηριστικά από την τελευταία πλήρως συνδεδεμένα επίπεδα

(3) ευρετήριο των διανυσμάτων χαρακτηριστικών σε μια πολυδιάστατη βάση δεδομένων που οργανώνεται με βάση την ταξινόμηση κατηγορίας που αποκτήθηκε στο προηγούμενο βήμα

(4) δημιουργήστε μια απλή μηχανή αναζήτησης για να προ-επεξεργαστείτε μια εικόνα ερωτήματος εισαγωγής και να εξαγάγετε τα οπτικά χαρακτηριστικά της χρησιμοποιώντας την ίδια εκπαιδευμένο convnet από το βήμα 1.

Ποια τεχνολογία χρησιμοποιεί;

Σε γενικές γραμμές, οι τεχνολογίες που μπορείτε να χρησιμοποιήσετε για να δημιουργήσετε και να αναπτύξετε αυτό το σύστημα ανάκτησης εικόνων με βάση τη βαθιά μάθηση είναι η Python ως η κύρια γλώσσα προγραμματισμού, ενορχηστρώνοντας ολόκληρη τη λογική.

Keras, ένα απλοποιημένο περιτύλιγμα για γρήγορη κατασκευή, δοκιμή και ανάπτυξη αρχιτεκτονικών βαθιάς μάθησης, που χτίστηκαν γύρω από πιο περίπλοκες μηχανές αριθμητικού υπολογισμού, όπως το TensorFlow και το Theano που αφαιρεί τον χρήστη της πολυπλοκότητας της κατασκευής ενός βαθύ νευρωνικού δικτύου. SQLite, μια βιβλιοθήκη σε διαδικασία που υλοποιεί μια αυτοτελή, χωρίς διακομιστή, μηδενική διαμόρφωση, συναλλαγή βάσης δεδομένων SQL.

Για την υποστήριξη δευτερευουσών λειτουργιών όπως χειρισμός συμβολοσειρών, πλαίσια δεδομένων ή αρχεία CSV, μπορούν να χρησιμοποιηθούν και άλλες βιβλιοθήκες Python. Όλα είναι διαθέσιμα εκτός συσκευασίας, εγκαθιστώντας τον υπεύθυνο διαχείρισης δεδομένων πακέτο Anaconda στην κορυφή του python.

Επόμενα βήματα

Η οικοδόμηση ενός μοντέλου βαθιάς μάθησης χρησιμοποιώντας προ-εκπαιδευμένα συνελικτικά νευρωνικά δίκτυα είναι μια προσβάσιμη πραγματικότητα χρησιμοποιώντας πλαίσια όπως το Keras, που αφαιρεί τον ερευνητή από την κατασκευή πολύπλοκων αλγορίθμων για να επικεντρωθεί στην άμεση κατασκευή του απαιτούμενου μοντέλου χρησιμοποιώντας απλές δομές κωδικοποίησης.

Γράψτε ένα σχόλιο