Επιστροφή στην Αρχική

Η Φιλοσοφία μας για τιςΕπενδύσεις σε ΤΝ

Γιατί πιστεύουμε ότι το μέλλον της ΤΝ έγκειται στην ενίσχυση της ανθρώπινης εμπειρογνωμοσύνης, όχι στην αντικατάστασή της

Το Πρόβλημα

Γιατί οι περισσότερες εταιρείες ΤΝ αποτυγχάνουν στον εταιρικό τομέα

Η προσπάθεια να αυτοματοποιηθεί τα πάντα παραβλέπει μια θεμελιώδη αλήθεια: Σε τομείς υψηλού κινδύνου, η ανθρώπινη κρίση δεν είναι σφάλμα προς διόρθωση, αλλά το κύριο χαρακτηριστικό.

Πλήρως Αυτοματοποιημένη ΤΝ

Κίνδυνος Υψηλός

Εξαλείφει την ανθρώπινη κρίση από κρίσιμες αποφάσεις, οδηγώντας σε αποτυχίες σε ακραίες περιπτώσεις και απώλεια θεσμικής γνώσης

Μοντέλα Μαύρου Κουτιού

Κίνδυνος Υψηλός

Η έλλειψη εξηγησιμότητας καθιστά αδύνατη την αιτιολόγηση αποφάσεων ή την κατανόηση τρόπων αποτυχίας σε ρυθμιζόμενους κλάδους

Λύσεις Γενικής Χρήσης

Κίνδυνος Μέτριος

Τα γενικά εργαλεία ΤΝ δεν αποτυπώνουν τις ειδικές για τον τομέα αποχρώσεις και την εμπειρική διαίσθηση που ορίζουν το ανταγωνιστικό πλεονέκτημα

Οι εταιρικοί πελάτες στην υγειονομική περίθαλψη, τις νομικές υπηρεσίες, τις χρηματοοικονομικές υπηρεσίες και άλλους ρυθμιζόμενους κλάδους δεν αναζητούν ΤΝ που να αντικαθιστά τους ειδικούς τους. Αναζητούν εργαλεία που να καθιστούν τους ειδικούς τους 10 φορές πιο αποτελεσματικούς, διατηρώντας παράλληλα τη λογοδοσία και τον έλεγχο.

Το Χάσμα μεταξύ Ρητής και Σιωπηρής Γνώσης

Κατανοώντας τι μπορεί να μάθει η ΤΝ από μόνα τα δεδομένα και τι όχι

Ρητή Γνώση

Πληροφορίες που μπορούν να κωδικοποιηθούν, να τεκμηριωθούν και να μεταδοθούν μέσω γραπτής ή προφορικής επικοινωνίας.

  • Ιατρικές διαγνώσεις βάσει συμπτωμάτων
  • Νομικά προηγούμενα και νομοθεσία
  • Χρηματοοικονομικοί τύποι και μετρήσεις
  • Τυποποιημένες λειτουργικές διαδικασίες

Η ΤΝ υπερέχει στην επεξεργασία ρητής γνώσης σε μεγάλη κλίμακα

Σιωπηρή Γνώση

Βαθιά εμπειρογνωμοσύνη που αποκτάται μέσω εμπειρίας και είναι δύσκολο να διατυπωθεί ή να μεταδοθεί.

  • Κλινική διαίσθηση για τον κίνδυνο ασθενών
  • Ένστικτα διαπραγμάτευσης σε συμφωνίες
  • Αναγνώριση προτύπων στην ανίχνευση απάτης
  • Κρίσεις που εξαρτώνται από το πλαίσιο

Εδώ η ανθρώπινη εμπειρογνωμοσύνη παραμένει αναντικατάστατη

Ο Τύπος της Επιτυχίας

Η ΤΝ επεξεργάζεται ρητή γνώση με υπερανθρώπινη ταχύτητα και κλίμακα.
Οι άνθρωποι παρέχουν σιωπηρή γνώση και τελική εξουσία απόφασης.

Αρχιτεκτονική Human-in-the-Loop

Πώς δομούμε συστήματα ΤΝ για αποφάσεις υψηλού κινδύνου

Βήμα 1

Επεξεργασία ΤΝ

Μοντέλα μηχανικής μάθησης αναλύουν δεδομένα, εντοπίζουν μοτίβα και παράγουν συστάσεις

Βήμα 2

Ανθρώπινη Επανεξέταση

Ειδικοί του τομέα εξετάζουν τα αποτελέσματα της ΤΝ, εφαρμόζουν γνώση πλαισίου και ασκούν κρίση

Βήμα 3

Απόφαση και Δράση

Τελικές αποφάσεις λαμβάνονται με ανθρώπινη λογοδοσία, δημιουργώντας ελεγκτικό ίχνος

Οφέλη

  • Διατηρεί την ανθρώπινη λογοδοσία στις αποφάσεις
  • Χτίζει εμπιστοσύνη με εταιρικούς πελάτες
  • Αποτυπώνει σιωπηρή γνώση στη ροή εργασίας
  • Δημιουργεί τεκμηριωμένα ελεγκτικά ίχνη
  • Επιτρέπει συνεχή βελτίωση του μοντέλου
  • Μειώνει τον κίνδυνο καταστροφικών αποτυχιών

Πραγματικός Αντίκτυπος

10x

Αύξηση παραγωγικότητας έναντι ανθρώπων χωρίς υποστήριξη

99,9%

Ακρίβεια σε αποφάσεις υψηλού κινδύνου

100%

Αποφάσεις με σαφή ανθρώπινη λογοδοσία

Παραδείγματα από Τομείς

Πώς η ΤΝ Human-in-the-Loop δημιουργεί αξία σε όλους τους κλάδους

Υγειονομική Περίθαλψη

Ρόλος ΤΝ

Αναλύει ιατρικές απεικονίσεις, επισημαίνει ανωμαλίες, προτείνει διαφορικές διαγνώσεις

Ανθρώπινος Ρόλος

Ο ακτινολόγος εξετάζει τα ευρήματα, λαμβάνει υπόψη το ιστορικό του ασθενούς, θέτει την τελική διάγνωση

Αποτέλεσμα

Ταχύτερος χρόνος απόκρισης με την ίδια ή καλύτερη ακρίβεια, σαφής αλυσίδα λογοδοσίας

Νομικός Τομέας

Ρόλος ΤΝ

Εξετάζει συμβόλαια, εντοπίζει μη τυποποιημένες ρήτρες, επισημαίνει περιοχές κινδύνου

Ανθρώπινος Ρόλος

Ο δικηγόρος αξιολογεί το επιχειρηματικό πλαίσιο, διαπραγματεύεται όρους, παρέχει συμβουλές

Αποτέλεσμα

80% εξοικονόμηση χρόνου στην επανεξέταση εγγράφων, οι δικηγόροι επικεντρώνονται στη στρατηγική

Χρηματοοικονομικές Υπηρεσίες

Ρόλος ΤΝ

Παρακολουθεί συναλλαγές, εντοπίζει ανωμαλίες, αξιολογεί πιθανότητα απάτης

Ανθρώπινος Ρόλος

Ο αναλυτής διερευνά επισημασμένες περιπτώσεις, εξετάζει το πλαίσιο του πελάτη, εγκρίνει/απορρίπτει

Αποτέλεσμα

10 φορές περισσότερες εξετασμένες περιπτώσεις με χαμηλότερο ποσοστό ψευδώς θετικών

Κατασκευή

Ρόλος ΤΝ

Παρακολουθεί δεδομένα αισθητήρων, προβλέπει βλάβες εξοπλισμού, συνιστά συντήρηση

Ανθρώπινος Ρόλος

Ο μηχανικός επικυρώνει προβλέψεις, προγραμματίζει παρεμβάσεις, βελτιστοποιεί λειτουργίες

Αποτέλεσμα

70% μείωση μη προγραμματισμένου χρόνου διακοπής, καλύτερη κατανομή πόρων

Δημιουργία Αμυντικών Τάφρων

Γιατί οι εταιρείες Human-in-the-Loop δημιουργούν ισχυρότερα ανταγωνιστικά πλεονεκτήματα

Εφέ Δικτύου Δεδομένων

Κάθε ανθρώπινη απόφαση βελτιώνει το μοντέλο. Όσο περισσότεροι ειδικοί χρησιμοποιούν το σύστημα, τόσο πιο πολύτιμο γίνεται για όλους τους χρήστες.

Ενσωμάτωση Ροής Εργασίας

Η βαθιά ενσωμάτωση στις ροές εργασίας ειδικών σημαίνει υψηλό κόστος εναλλαγής. Το σύστημα γίνεται μέρος του τρόπου εργασίας των ομάδων.

Εμπειρογνωμοσύνη Τομέα

Απαιτεί βαθιά κατανόηση των ροών εργασίας και των κανονισμών του κλάδου. Γενικές εταιρείες ΤΝ δεν μπορούν εύκολα να το αναπαράγουν.

Συνεχής Μάθηση

Η ανθρώπινη ανατροφοδότηση δημιουργεί έναν μηχανισμό αυτοενίσχυσης: Καλύτερη ΤΝ προσελκύει περισσότερους χρήστες, περισσότεροι χρήστες παράγουν καλύτερα δεδομένα εκπαίδευσης.

Το Σύνθετο Πλεονέκτημα

Έτος 1

Αρχικό μοντέλο + Ανατροφοδότηση πρώιμων υιοθετών

Έτος 2

Βελτιωμένη ακρίβεια προσελκύει περισσότερους πελάτες

Έτος 3+

Κορυφαία απόδοση αγοράς, δύσκολη εκτόπιση

Σε αντίθεση με καθαρές στρατηγικές αυτοματισμού που γίνονται γρήγορα εμπορεύματα, τα συστήματα Human-in-the-Loop συσσωρεύουν ιδιόκτητη γνώση που αυξάνεται με την πάροδο του χρόνου. Όσο περισσότερο χρόνο λειτουργεί μια εταιρεία, τόσο ευρύτερη γίνεται η τάφρος της.

Τα Κριτήρια Επένδυσής μας

Τι αναζητούμε σε εταιρείες ΤΝ Human-in-the-Loop

Σαφής Ανθρώπινος Ρόλος

Το σύστημα ορίζει ρητά πού προσθέτουν αξία οι άνθρωποι και διατηρεί τη λογοδοσία

Εταιρική GTM Στρατηγική

Πώληση σε επιχειρήσεις με προϋπολογισμό και απαιτήσεις συμμόρφωσης, όχι σε καταναλωτικές αγορές

Εμπειρογνωμοσύνη Τομέα

Η ομάδα ιδρυτών διαθέτει βαθιά εμπειρία στον κλάδο για τον οποίο κατασκευάζουν

Είστε έτοιμοι να διαμορφώσετε το μέλλον;

Εάν κατασκευάζετε ΤΝ Human-in-the-Loop για έναν τομέα υψηλού κινδύνου, θέλουμε να σας ακούσουμε.

$500K-$2M

Αρχική Επένδυση

Pre-Seed/Seed

Στάδιο Στόχευσης

48 Ώρες

Χρόνος Απόκρισης

Η Βασική Ιδέα

Το Χάσμα Ρητής-Σιωπηρής Γνώσης:
γιατί εμφανίζεται παντού.

Οι επιστημολόγοι διακρίνουν μεταξύ δύο ειδών γνώσης. Αυτή η διάκριση είναι το διανοητικό θεμέλιο της επενδυτικής θέσης της Noodle — και ο λόγος που το πρόβλημα που λύνουμε είναι δομικό, όχι τυχαίο.

Ρητή Γνώση

Η ΤΝ το χειρίζεται καλά

Η γραπτή διαδικασία, ο δημοσιευμένος κανόνας, η τεκμηριωμένη βέλτιστη πρακτική. Τα συστήματα ΤΝ είναι εξαιρετικά ικανά να ανακτούν, να συνθέτουν και να εφαρμόζουν αυτό το επίπεδο — ταχύτερα και πιο συνεπώς από οποιονδήποτε ανθρώπινο επαγγελματία.

Παραδείγματα: Ρυθμιστικά παραρτήματα MARPOL, κλινικά πρωτόκολλα βασισμένα σε στοιχεία, εθνικά πλαίσια σπουδών, βιομηχανική αθλητική έρευνα.

Σιωπηρή Γνώση

Ο κυρίαρχος παράγοντας για αποτελέσματα

Ο κλινικός ιατρός που γνωρίζει ότι αυτός ο συγκεκριμένος ασθενής δεν θα τηρήσει το τυπικό πρωτόκολλο, ανεξάρτητα από το τι συνιστάται. Ο προπονητής που βλέπει ότι το backhand ενός παίκτη καταρρέει υπό ψυχολογική πίεση, όχι λόγω φυσικής κόπωσης. Ο υπεύθυνος συμμόρφωσης που γνωρίζει ότι μια συγκεκριμένη ρυθμιστική αρχή εφαρμόζει αυτή τη στιγμή αυστηρότερη ερμηνεία από ό,τι απαιτεί το δημοσιευμένο κείμενο.

Αυτή η γνώση είναι ενσωματωμένη, σχεσιακή και πλαισιακή. Ζει σε ανθρώπους, όχι σε βάσεις δεδομένων. Και είναι ο κυρίαρχος παράγοντας για την ποιότητα των αποτελεσμάτων σε πρακτικά όλους τους υψηλής αξίας τομείς.

Οι εταιρείες που μαθαίνουν να γεφυρώνουν συστηματικά το χάσμα ρητής-σιωπηρής γνώσης θα ξεπεράσουν εκείνες που δεν το κάνουν. Σημαντικά. Μόνιμα.

Σημείωση Επιστήμης Δεδομένων: Επισημοποιώντας το Χάσμα

Σε Bayesian όρους, η ρητή γνώση αποτελεί το Prior: καλά τεκμηριωμένο, σταθερό, μεταφέρσιμο. Η σιωπηρή γνώση είναι η Συνάρτηση Πιθανοφάνειας — η λεπτομερής, ευαίσθητη στο πλαίσιο ενημέρωση που μετατρέπει ένα γενικό prior σε ένα χρήσιμο posterior για αυτήν τη συγκεκριμένη κατάσταση.

Τα τρέχοντα συστήματα ΤΝ είναι εξαιρετικά καλά στην προσέγγιση των priors. Είναι δομικά ανίκανα να συλλάβουν συναρτήσεις πιθανοφάνειας που δεν γράφτηκαν ποτέ. Το χάσμα ρητής-σιωπηρής γνώσης είναι επίσημα η διαφορά μεταξύ:

  • P(αποτέλεσμα | τεκμηριωμένο πλαίσιο) — για το οποίο βελτιστοποιεί η ΤΝ
  • P(αποτέλεσμα | τεκμηριωμένο πλαίσιο + σχεσιακό πλαίσιο + κρίση επαγγελματία) — τι απαιτούν πραγματικά οι αποφάσεις

Το δέλτα μεταξύ αυτών των δύο κατανομών είναι όπου καταστρέφεται η αξία, και όπου λειτουργεί η Noodle.

Η Αρχιτεκτονική Μετατόπιση

Από Πιθανοτικό
σε Ντετερμινιστικό

Αυτή είναι η πιο παρεξηγημένη πτυχή της ανάπτυξης ΤΝ σε κλίμακα και κεντρική στο γιατί η προσέγγιση της Noodle δημιουργεί διατηρήσιμο ανταγωνιστικό πλεονέκτημα.

Γιατί η καθαρή ΤΝ είναι αναπόφευκτα πιθανοτική

Ένα γλωσσικό μοντέλο ή προβλεπτικό σύστημα παράγει εξόδους που είναι στατιστικά πιθανές δεδομένης της κατανομής εκπαίδευσής του. Δεν μπορεί να είναι αλλιώς: το μοντέλο δεν έχει ποτέ συναντήσει αυτόν τον ασθενή, αυτή τη ρυθμιστική αρχή, τη συναισθηματική κατάσταση αυτού του μαθητή σήμερα. Κάθε έξοδος είναι θεμελιωδώς μια εκτίμηση — μια κατανομή πιθανότητας πάνω από πιθανές σωστές απαντήσεις, συμπτυγμένη σε μία μόνο απάντηση.

Αυτό δεν είναι ελάττωμα. Είναι αρχιτεκτονική ιδιότητα. Το ερώτημα δεν είναι «Πώς κάνουμε την ΤΝ αληθινή;» Το ερώτημα είναι «Πώς αγκυροβολούμε τις πιθανοτικές εξόδους στις ντετερμινιστικές απαιτήσεις του πραγματικού κόσμου;»

Πώς το HITL μετατοπίζει το σύστημα προς τον ντετερμινισμό

Το επίπεδο Human-in-the-Loop δεν εξαλείφει την πιθανοτική συλλογιστική. Μετατρέπει τις πιθανοτικές εξόδους ΤΝ σε αποφάσεις που ικανοποιούν τα ντετερμινιστικά πρότυπα που πραγματικά απαιτούν τα αποτελέσματα.

Πιθανοτική Έξοδος ΤΝΝτετερμινιστική Απαίτηση
Η πιο πιθανή θεραπεία για αυτήν την παρουσίαση είναι XΑυτός ο ασθενής δεν θα συμμορφωθεί με το X· συνταγογραφήστε Y
Αυτή η υποβολή πιθανώς συμμορφώνεται με τον κανονισμό ZΑυτή η ρυθμιστική αρχή απαιτεί ρητή αναφορά στην παράγραφο 4.2 — προσθέστε την
Η απόδοση αυτού του μαθητή υποδηλώνει εστίαση στην άλγεβραΑυτός ο μαθητής μπλοκάρει υπό χρονική πίεση — προσαρμόστε τη μορφή αξιολόγησης

Ο ανθρώπινος ειδικός δεν αντικαθιστά την ΤΝ. Την πλαισιοποιεί — μετατρέποντας μια στατιστικά έγκυρη απάντηση σε μια καταστασιακά σωστή. Με την πάροδο του χρόνου, μέσω της αρχιτεκτονικής προοδευτικής κωδικοποίησής μας, αυτές οι πλαισιακές διορθώσεις τροφοδοτούνται συστηματικά πίσω στο σύστημα, μετατοπίζοντας την κατανομή εξόδου του μοντέλου προς τις ντετερμινιστικές απαιτήσεις του τομέα.

Σημείωση Επιστήμης Δεδομένων: Μείωση Επιστημολογικής Αβεβαιότητας μέσω Ανθρώπινης Ανατροφοδότησης

Υπάρχουν δύο διακριτές πηγές αβεβαιότητας στα προβλεπτικά συστήματα:

  • Αλεατορική Αβεβαιότητα: αναπόφευκτος θόρυβος εγγενής στη διαδικασία παραγωγής δεδομένων
  • Επιστημολογική Αβεβαιότητα: αβεβαιότητα μοντέλου που προκύπτει από ανεπαρκή ή μη αντιπροσωπευτικά δεδομένα εκπαίδευσης

Οι τρέχουσες αποτυχίες ΤΝ σε τομείς υψηλού κινδύνου είναι κατά κύριο λόγο επιστημολογικές, όχι αλεατορικές. Η σιωπηρή γνώση που οδηγεί την ποιότητα των αποτελεσμάτων απλά δεν υπάρχει σε κανένα σύνολο εκπαίδευσης. Η βελτίωση HITL λειτουργεί ως δομημένος μηχανισμός για τη μείωση της επιστημολογικής αβεβαιότητας — κάθε ανθρώπινη διόρθωση είναι ένα επισημασμένο δείγμα από την πραγματική οπίσθια κατανομή στην οποία το μοντέλο δεν μπορεί να έχει πρόσβαση μόνο μέσω προεκπαίδευσης.

Πιο ακριβώς: κάθε παρέμβαση HITL παράγει μια πλειάδα (πλαίσιο, έξοδος ΤΝ, διόρθωση ειδικού, αποτέλεσμα). Με την πάροδο του χρόνου, αυτές οι πλειάδες γεμίζουν την αποτελεσματική κατανομή εκπαίδευσης του μοντέλου με παραδείγματα από ακριβώς την περιοχή κατανομής όπου η επιστημολογική του αβεβαιότητα ήταν υψηλότερη. Αυτό είναι ενεργή μάθηση σε επίπεδο τομέα.

Σε τι επενδύουμε

Η Αρχιτεκτονική HITL:
μια δομική τάφρος, όχι χαρακτηριστικό.

Η Noodle επενδύει σε εταιρείες που είναι χτισμένες πάνω στην αρχιτεκτονική βελτίωσης Human-in-the-Loop (HITL) — μια δομημένη μεθοδολογία για την παρεμβολή εξόδων ΤΝ, τον εμπλουτισμό τους με πλαισιακή ανθρώπινη κρίση και την προοδευτική επανακωδικοποίηση αυτής της κρίσης στο σύστημα.

Αυτό δεν είναι ένα chatbot με ανθρώπινο αξιολογητή. Είναι μια σύνθετη υποδομή γνώσης.

Φάση 1

Εξαγωγή Σιωπηρής Γνώσης

Πριν η ΤΝ αγγίξει οποιαδήποτε ροή εργασίας, αναδύουμε τους σιωπηρούς κανόνες, τις ευρετικές και τις εξαιρέσεις των καλύτερων επαγγελματιών του τομέα. Μετατρέπουμε τη ζώσα εμπειρία σε δομημένο πλαίσιο μέσα στο οποίο μπορεί να λειτουργήσει η ΤΝ — όχι ως μεταγενέστερη σκέψη, αλλά ως θεμέλιο.

Φάση 2

Ανθρώπινη Παρέμβαση και Βελτίωση

Η ΤΝ παράγει το πρώτο προσχέδιο. Οι ειδικοί του τομέα το αναδιαμορφώνουν — όχι για να διορθώσουν σφάλματα, αλλά για να μεταφράσουν μια τεχνικά έγκυρη έξοδο σε μια πλαισιακά εφαρμόσιμη. Αυτή είναι η διαφορά μεταξύ ενός σχεδίου που είναι σωστό και ενός που θα λειτουργήσει πραγματικά σε αυτήν την κατάσταση, με αυτό το άτομο, υπό αυτές τις συνθήκες.

Φάση 3

Προοδευτική Κωδικοποίηση Γνώσης

Κάθε βελτίωση επιστρέφει σε βελτιωμένες προτροπές, πλαισιακές οδηγίες και μοτίβα ειδικά για τον τομέα. Το ανθρώπινο επίπεδο διδάσκει συνεχώς το σύστημα. Με την πάροδο του χρόνου, το κόστος παρέμβασης μειώνεται ενώ η βασική ποιότητα εξόδου αυξάνεται. Έτσι κλιμακώνεται το μοντέλο, χωρίς να προστίθεται απλώς προσωπικό.

Φάση 4

Βρόχοι Ανατροφοδότησης με βάση Αποτελέσματα

Τα πραγματικά αποτελέσματα επιστρέφουν στο σύστημα. Ο βρόχος δεν κλείνει στην ικανοποίηση χρηστών, αλλά στα πραγματικά αποτελέσματα: Η υποβολή συμμόρφωσης άντεξε τον έλεγχο; Βελτιώθηκε το ποσοστό σερβίς του αθλητή; Αυξήθηκε η βαθμολογία του μαθητή; Τα δεδομένα απόδοσης βελτιώνουν κάθε επόμενο κύκλο.

Σημείωση Επιστήμης Δεδομένων: Ο Βρόχος HITL ως Σήμα Ενισχυτικής Μάθησης

Η τετραφασική αρχιτεκτονική αντιστοιχεί απευθείας σε ένα πλαίσιο ενισχυτικής μάθησης:

  • Κατάσταση: το τρέχον πλαίσιο του τομέα (ασθενής, αθλητής, κανονιστικό περιβάλλον, μαθητής)
  • Ενέργεια: η σύσταση εξόδου ΤΝ
  • Ανθρώπινη Βελτίωση: ένα σήμα διόρθωσης πολιτικής από έναν ειδικό που ενεργεί ως μοντέλο ανταμοιβής
  • Ανατροφοδότηση Αποτελέσματος: το πραγματικό σήμα ανταμοιβής που κλείνει τον βρόχο από το περιβάλλον στην πολιτική

Σε αντίθεση με το τυπικό RLHF (Reinforcement Learning from Human Feedback) που χρησιμοποιεί γενικά δεδομένα προτίμησης, η αρχιτεκτονική της Noodle παράγει σήματα ανταμοιβής που είναι ειδικά για τον τομέα, επικυρωμένα από αποτελέσματα και σωρευτικά. Το μοντέλο ανταμοιβής δεν είναι proxy — είναι πραγματικά δεδομένα απόδοσης του τομέα. Αυτό παράγει ένα θεμελιωδώς πιο ευκρινές και αξιόπιστο σήμα βελτιστοποίησης από τη λεπτή ρύθμιση μόνο βάσει προτιμήσεων.

Πραγματιστική Νοημοσύνη

Γιατί οι Πραγματιστικές Προσεγγίσεις
Νικούν τις Σωστές

Αυτή η αρχή είναι αντιδιαισθητική, και είναι ένα από τα σημαντικότερα διδάγματα από την ανάπτυξη ΤΝ σε κλίμακα.

Τα συστήματα ΤΝ βελτιστοποιούν για ορθότητα: η απάντηση που είναι πιο συνεπής με τα τεκμηριωμένα στοιχεία, πιο στατιστικά πιθανή δεδομένων των δεδομένων εκπαίδευσης, πιο ευθυγραμμισμένη με τις δημοσιευμένες βέλτιστες πρακτικές. Αυτό είναι ακριβώς αυτό που πρέπει να κάνουν, και ακριβώς γιατί αποτυγχάνουν στην ανάπτυξη.

Τα αποτελέσματα του πραγματικού κόσμου δεν καθορίζονται από σωστές απαντήσεις. Καθορίζονται από απαντήσεις που λειτουργούν — δεδομένου του ποιος είναι στο δωμάτιο, ποιοι περιορισμοί είναι ενεργοί, ποιες σχέσεις είναι σε παιχνίδι και ποια ιστορία προηγείται αυτής της στιγμής.

Το Χάσμα Μεταξύ Σωστού και Αποτελεσματικού

Μια κλινικά σωστή σύσταση θεραπείας που ένας ασθενής δεν θα ακολουθήσει είναι κατώτερη από ένα ελαφρώς λιγότερο βέλτιστο πρωτόκολλο που πραγματικά θα υιοθετήσει.

Μια τεχνικά ορθή νομική υποβολή που χρησιμοποιεί γλώσσα που ένας συγκεκριμένος ρυθμιστής βρίσκει αντιπαραθετική θα αποδώσει χειρότερα από μία πραγματιστικά διατυπωμένη.

Μια παιδαγωγικά βέλτιστη ακολουθία μάθησης που ένας συγκεκριμένος μαθητής βιώνει ως συντριπτική θα παράγει χειρότερα αποτελέσματα από μια πιο ήπια προσέγγιση που διατηρεί την αφοσίωση.

Ο επαγγελματίας που γνωρίζει τη διαφορά μεταξύ αυτών των επιλογών δεν παρακάμπτει την ΤΝ. Κάνει τη δουλειά που η ΤΝ δεν μπορεί να κάνει: να χαρτογραφήσει μια σωστή απάντηση στις συνθήκες του πραγματικού κόσμου που καθορίζουν αν θα επιτύχει.

Πώς το HITL κωδικοποιεί την πραγματιστική νοημοσύνη

Ο μηχανισμός προοδευτικής κωδικοποίησης συλλαμβάνει αυτή την πραγματιστική νοημοσύνη συστηματικά. Όταν ένας ειδικός συμμόρφωσης προσαρμόζει μια υποβολή ΤΝ για να ταιριάζει στις προτιμήσεις ενός συγκεκριμένου ρυθμιστή — και η υποβολή είναι συνεπώς επιτυχής — το σύστημα μαθαίνει την προτίμηση. Όταν ένας προπονητής τροποποιεί ένα σχέδιο προπόνησης ΤΝ επειδή ένας συγκεκριμένος αθλητής χρειάζεται αυτοπεποίθηση περισσότερο από φορτίο αυτή την εβδομάδα — και τα αποτελέσματα αγώνα βελτιώνονται — το σύστημα μαθαίνει την πλαισιακή προτεραιότητα βαρύτητας.

Με την πάροδο του χρόνου, το χάσμα μεταξύ «σωστού» και «αποτελεσματικού» στενεύει. Όχι επειδή η ΤΝ γίνεται πιο σωστή, αλλά επειδή γίνεται πιο πλαισιακά βαθμονομημένη. Αυτό είναι ένα ποιοτικά διαφορετικό είδος βελτίωσης — και ένα που είναι ειδικό για τον τομέα, τις σχέσεις και την ιστορία που η Noodle έχει χτίσει. Δεν μπορεί να αναπαραχθεί με την ανάπτυξη ενός καλύτερου βασικού μοντέλου.

Σημείωση Επιστήμης Δεδομένων: Αναντιστοιχία Συνάρτησης Απώλειας και γιατί Επιμένει

Το πρόβλημα σωστό-vs-πραγματικό είναι ένα πρόβλημα αναντιστοιχίας συνάρτησης απώλειας που είναι δομικά ανθεκτικό σε τυπικές λύσεις ML.

Η απώλεια εκπαίδευσης ελαχιστοποιεί το σφάλμα έναντι της κατανομής εκπαίδευσης. Αλλά η «πραγματιστική αποτελεσματικότητα» δεν περιέχεται στην κατανομή εκπαίδευσης — είναι μια αναδυόμενη ιδιότητα ενός συγκεκριμένου πλαισίου ανάπτυξης, συγκεκριμένων ανθρώπινων σχέσεων και συγκεκριμένων ακολουθιών ιστορικής αλληλεπίδρασης. Δεν μπορεί να επισημανθεί εκ των προτέρων.

Γι' αυτό η κλιμάκωση του μεγέθους μοντέλου, η προσθήκη περισσότερων δεδομένων εκπαίδευσης ή η εφαρμογή RLHF σε γενικά δεδομένα προτίμησης δεν κλείνουν το χάσμα. Το σήμα που θα το έκλεινε — «Λειτούργησε αυτή η συγκεκριμένη έξοδος για αυτό το συγκεκριμένο άτομο σε αυτό το συγκεκριμένο πλαίσιο;» — υπάρχει μόνο σε βρόχους ανατροφοδότησης ανάπτυξης.

Η αρχιτεκτονική της Noodle είναι ειδικά σχεδιασμένη για να συλλάβει, να δομήσει και να επανατροφοδοτήσει αυτό το σήμα. Είναι λύση σε ένα πρόβλημα που οι πάροχοι βασικών μοντέλων δεν μπορούν να λύσουν.

Γιατί το Εύρος είναι το Σημείο

Μία Αρχιτεκτονική.
Τέσσερις Τομείς. Το Ίδιο Πλεονέκτημα.

Το χάσμα ρητής-σιωπηρής γνώσης προκύπτει παντού όπου αναπτύσσεται η ΤΝ. Η μεθοδολογία για να το κλείσει είναι μεταφέρσιμη. Επεκτείνετε κάθε τομέα για να δείτε πώς εκτυλίσσεται.

Ανταγωνιστική Θέση

Γιατί Είναι Αμυνόμενο:
Οι τρεις σύνθετες τάφροι της Noodle.

Μεταφέρσιμη Μεθοδολογία Τομέα. Βάθος Ειδικό για Τομέα.

Η αρχιτεκτονική HITL είναι μεταφέρσιμη σε κλάδους. Η σιωπηρή γνώση που αποτυπώνει σε κάθε κλάδο δεν είναι. Μια βάση γνώσης ναυτιλιακής συμμόρφωσης που χτίστηκε μέσω του επιπέδου μας δεν μπορεί να αναπαραχθεί από έναν ανταγωνιστή που εισέρχεται στον χώρο — είναι χτισμένη από χρόνια εξειδίκευσης ειδικών και είναι ειδική για τις σχέσεις, τις δικαιοδοσίες και τις ακραίες περιπτώσεις που έχουμε συναντήσει. Η μεθοδολογία είναι η μηχανή μας. Η συσσωρευμένη γνώση είναι η τάφρος μας.

Το Ανθρώπινο Επίπεδο Κωδικοποιεί τον Εαυτό του Εκτός Ύπαρξης — με Περιθώριο.

Καθώς οι ανθρώπινοι ειδικοί μας βελτιώνουν τις εξόδους ΤΝ, κωδικοποιούν συστηματικά την κρίση τους στο σύστημα. Με την πάροδο του χρόνου, η ΤΝ απαιτεί λιγότερη ανθρώπινη παρέμβαση για να επιτύχει το ίδιο κατώφλι ποιότητας. Το κόστος παράδοσης πέφτει ενώ η ποιότητα εξόδου αυξάνεται. Οι ανταγωνιστές που βασίζονται στην ακατέργαστη έξοδο ΤΝ δεν το πετυχαίνουν ποτέ. Οι ανταγωνιστές που βασίζονται στην καθαρά ανθρώπινη παράδοση δεν μπορούν να το κλιμακώσουν. Βρισκόμαστε στη διασταύρωση.

Κόστη Αλλαγής που Συνθέτονται με το Βάθος Σχέσης.

Όσο περισσότερο χρόνο λειτουργεί η αρχιτεκτονική της Noodle σε έναν τομέα — με έναν επαγγελματία, έναν πελάτη, έναν θεσμό — τόσο περισσότερη σιωπηρή γνώση έχει εξαχθεί και κωδικοποιηθεί. Η αντικατάστασή μας σημαίνει απώλεια αυτής της θεσμικής και ατομικής μνήμης. Το stack ΤΝ που χτίζεται πάνω στο επίπεδό μας γίνεται εξαρτημένο από το επίπεδο πλαισίου που έχουμε χτίσει. Αυτό το πλαίσιο δεν μεταφέρεται σε ανταγωνιστή.

Η Επενδυτική Περίπτωση

Όχι Καλύτερο Μοντέλο.
Το Επίπεδο που κάνει κάθε Μοντέλο να Λειτουργεί.

Ο τρέχων κύκλος ανάπτυξης ΤΝ παράγει μια μεγάλη και αυξανόμενη κατηγορία απογοητεύσεων: ικανά συστήματα, κακά αποτελέσματα, απογοητευμένοι χρήστες. Ο τρόπος αποτυχίας είναι σχεδόν πάντα ο ίδιος — το χάσμα ρητής-σιωπηρής γνώσης.

Οι εταιρείες που λύνουν αυτό το πρόβλημα συστηματικά, σε τομείς, με μεθοδολογία που κλιμακώνεται και συντίθεται, θα αποτυπώσουν δυσανάλογη αξία στην επόμενη φάση υιοθέτησης ΤΝ. Η Noodle Investments™ χτίζει και υποστηρίζει ακριβώς αυτές τις εταιρείες.

Δεν στοιχηματίζουμε σε καλύτερο μοντέλο. Στοιχηματίζουμε στο επίπεδο που κάνει κάθε μοντέλο να λειτουργεί πραγματικά — στον πραγματικό κόσμο, για πραγματικούς ανθρώπους, υπό συνθήκες που κανένα σύνολο δεδομένων εκπαίδευσης δεν έχει πλήρως προβλέψει.

Τεχνικό Παράρτημα

Ένα Πλαίσιο Επιστήμης Δεδομένων
για τη Θέση της Noodle

Αυτό το παράρτημα επισημοποιεί την επενδυτική θέση για τεχνικά κοινά, αντιστοιχίζοντας τις βασικές έννοιες σε καθιερωμένα πλαίσια μηχανικής μάθησης, επιστημολογίας και σχεδιασμού συστημάτων.

Για περαιτέρω συζητήσεις σχετικά με την τεχνική αρχιτεκτονική, την υποδομή δεδομένων ή τα μοντέλα ανάπτυξης ειδικά για τομέα, επικοινωνήστε με την επενδυτική ομάδα της Noodle.