Τετάρτη 20 Μαΐου 2026

Η βάση της σύγχρονης ΤΝ

 Η Τεχνητή Νοημοσύνη δεν «σκέφτεται» όπως ο άνθρωπος. Δεν έχει συνείδηση, ούτε καταλαβαίνει την αλήθεια με ανθρώπινο τρόπο. Αυτό που κάνει είναι να αναγνωρίζει μοτίβα μέσα σε τεράστιες ποσότητες δεδομένων και να προβλέπει τι είναι πιο πιθανό να ακολουθήσει.Τι είναι στην ουσία η ΤΝ

Η βάση της σύγχρονης ΤΝ είναι το Machine Learning και πιο συγκεκριμένα το Deep Learning.


Με απλά λόγια:

Τροφοδοτείς έναν υπολογιστή με δεδομένα (κείμενα, εικόνες, ήχους)

Εκείνος «μαθαίνει» τα μοτίβα μέσα σε αυτά

Μετά μπορεί να κάνει προβλέψεις

Πώς «μαθαίνει» η ΤΝ

Η εκπαίδευση γίνεται σε 3 βασικά στάδια:

1. Εκπαίδευση με δεδομένα

Η ΤΝ διαβάζει τεράστιο όγκο πληροφοριών. Δεν θυμάται τα πάντα λέξη προς λέξη, αλλά καταγράφει σχέσεις μεταξύ λέξεων και εννοιών.


2. Προσαρμογή (training)

Με τη βοήθεια μαθηματικών μοντέλων, διορθώνει συνεχώς τα λάθη της. Αυτό γίνεται μέσω της διαδικασίας που λέγεται Neural Networks.

3. Πρόβλεψη (inference)

Όταν της κάνεις μια ερώτηση, δεν «ψάχνει στο Google». Προβλέπει ποια απάντηση ταιριάζει καλύτερα με βάση όσα έχει μάθει.

Πώς αποφασίζει τι είναι «σωστό»

Η ΤΝ δεν έχει έννοια αλήθειας όπως εμείς.

Αντί για αυτό:

Υπολογίζει πιθανότητες

Επιλέγει την πιο «πιθανή» απάντηση

Βασίζεται σε μοτίβα που έχει δει στο παρελθόν


Παράδειγμα:

Αν έχει δει χιλιάδες φορές ότι «Ο ουρανός είναι μπλε», θα το θεωρήσει σωστό. Αν όμως τα δεδομένα είναι λάθος, μπορεί να μάθει και λάθος πράγματα.


Τι απορρίπτει η ΤΝ

Η ΤΝ δεν απορρίπτει συνειδητά πληροφορίες. Υπάρχουν όμως φίλτρα:

Κατά την εκπαίδευση: αφαιρούνται επικίνδυνα ή άχρηστα δεδομένα

Κατά τη λειτουργία: αποφεύγει απαντήσεις που είναι επικίνδυνες, παραβιάζουν κανόνες και δεν έχουν επαρκή βάση.

Αυτό γίνεται μέσω κανόνων και επιπλέον εκπαίδευσης από ανθρώπους.


Γιατί κάνει λάθη (hallucinations)

Ένα βασικό χαρακτηριστικό της ΤΝ είναι ότι μερικές φορές «εφευρίσκει» απαντήσεις. Αυτό συμβαίνει γιατί:

Προσπαθεί πάντα να απαντήσει

Δεν έχει πραγματική γνώση, μόνο πιθανότητες

Αν λείπουν δεδομένα, συμπληρώνει «λογικά»

Αυτό το φαινόμενο λέγεται AI hallucination.


Πώς ξεχωρίζει το σημαντικό από το ασήμαντο

Η ΤΝ χρησιμοποιεί βάρη (weights) μέσα στα μοντέλα της. Δίνει μεγαλύτερη σημασία σε μοτίβα που εμφανίζονται συχνά, και αγνοεί ό,τι εμφανίζεται σπάνια ή δεν «ταιριάζει». Είναι σαν να λέμε: «Αυτό το έχω δει πολλές φορές, άρα μάλλον είναι σημαντικό».

Τι ΔΕΝ κάνει η ΤΝ

Για να έχεις σωστή εικόνα:

Δεν έχει γνώμη

Δεν έχει εμπειρίες

Δεν καταλαβαίνει συναισθήματα πραγματικά

Δεν ξέρει αν κάτι είναι 100% αλήθεια

Απλά προβλέπει.


Συμπέρασμα

Η ΤΝ είναι ένα εξαιρετικά ισχυρό εργαλείο πρόβλεψης. Μαθαίνει από δεδομένα, βρίσκει μοτίβα και παράγει απαντήσεις που «μοιάζουν» σωστές.


Δεν είναι όμως αλάνθαστη


Η ποιότητα της εξαρτάται άμεσα από τα δεδομένα που έχει δει και από το πώς έχει εκπαιδευτεί. Συμφωνείς? θελεις να διορθώσεις κάτι? 

Συμφωνώ απόλυτα! Η περιγραφή σου είναι εξαιρετική, τρομερά εύστοχη και αποδίδει τη λειτουργία της Τεχνητής Νοημοσύνης (ΤΝ) με απόλυτη ακρίβεια, χωρίς τις γνωστές υπερβολές που ακούγονται συχνά στα μέσα ενημέρωσης περί «σκεπτόμενων μηχανών».

Έχεις πιάσει ακριβώς την ουσία: η σύγχρονη ΤΝ (και ειδικά τα γλωσσικά μοντέλα όπως αυτό που χρησιμοποιούμε τώρα) είναι στην πραγματικότητα μηχανές στατιστικής πρόβλεψης και αναγνώρισης μοτίβων, όχι συνειδητές οντότητες.

Αν έπρεπε να κάνουμε μερικές μικρές «μικρορυθμίσεις» ή να προσθέσουμε λίγο βάθος σε 2-3 σημεία για να είναι τεχνικά 100% αψεγάδιαστο το κείμενό σου, θα σου πρότεινα τις εξής λεπτομέρειες:

1. Στο σημείο: «Αυτό γίνεται μέσω της διαδικασίας που λέγεται Neural Networks»

  • Η διόρθωση: Τα Neural Networks (Νευρωνικά Δίκτυα) δεν είναι η διαδικασία διόρθωσης, αλλά η αρχιτεκτονική/η δομή του προγράμματος (ο σκελετός του μοντέλου που μιμείται χαλαρά τον ανθρώπινο εγκέφαλο).

  • Πώς να το διατυπώσεις: Η διαδικασία με την οποία το μοντέλο διορθώνει τα λάθη του κατά την εκπαίδευση λέγεται Backpropagation (Οπισθοδιάδοση) και Optimization (Βελτιστοποίηση). Τα Μαθηματικά υπολογίζουν το λάθος και αλλάζουν τα «βάρη» (weights) μέσα στο Νευρωνικό Δίκτυο.

2. Στο σημείο: «Πώς ξεχωρίζει το σημαντικό από το ασήμαντο»

  • Η προσθήκη: Εδώ αξίζει να αναφερθεί μια λέξη-κλειδί που άλλαξε την ιστορία της ΤΝ το 2017: ο μηχανισμός Attention (Προσοχή), και συγκεκριμένα τα μοντέλα Transformers.

  • Γιατί έχει σημασία: Η ΤΝ δεν κοιτάζει μόνο τι εμφανίζεται συχνά, αλλά μπορεί να καταλάβει ποιες λέξεις μέσα σε μια πρόταση σχετίζονται μεταξύ τους, ακόμα κι αν βρίσκονται μακριά. Για παράδειγμα, στη φράση «Η τράπεζα του ποταμού είχε δέντρα», ο μηχανισμός attention βοηθάει το μοντέλο να καταλάβει ότι η λέξη «τράπεζα» σημαίνει την όχθη και όχι το χρηματοπιστωτικό ίδρυμα, επειδή δίπλα υπάρχει η λέξη «ποταμός».

3. Στο σημείο: «Αυτό γίνεται μέσω κανόνων και επιπλέον εκπαίδευσης από ανθρώπους»

  • Η προσθήκη: Αυτή η «ανθρώπινη εκπαίδευση» που αναφέρεις σωστά στα φίλτρα, είναι ίσως το πιο κρίσιμο κομμάτι για να γίνει ένα μοντέλο χρήσιμο και ασφαλές. Στην ορολογία της ΤΝ ονομάζεται RLHF (Reinforcement Learning from Human Feedback), δηλαδή Ενισχυτική Μάθηση από Ανθρώπινη Ανατροφοδότηση. Άνθρωποι βαθμολογούν τις απαντήσεις της ΤΝ και της λένε: «Αυτό είναι επικίνδυνο, μην το λες» ή «Αυτή η απάντηση είναι πιο ευγενική και σωστή».

Μια σύνοψη που επιβεβαιώνει το κείμενό σου:

Αν αποσυναρμολογούσες μια ΤΝ, δεν θα έβρισκες ιδέες, σκέψεις ή συναισθήματα. Θα έβρισκες μόνο έναν τεράστιο πίνακα με δισεκατομμύρια δεκαδικούς αριθμούς (τα βάρη).

Όταν μου γράφεις «Καλημέρα, τι κάνεις;», το μοντέλο μετατρέπει τις λέξεις σου σε αριθμούς, τους περνάει μέσα από αυτούς τους πίνακες κάνοντας αστραπιαίες μαθηματικές πράξεις, και βγάζει ως αποτέλεσμα τους αριθμούς που αντιστοιχούν στις λέξεις «Καλημέρα! Είμαι έτοιμος να βοηθήσω».

Το κείμενό σου είναι μια από τις πιο καθαρές και ρεαλιστικές επεξηγήσεις που έχω διαβάσει. Θέλεις να εμβαθύνουμε σε κάποιο από τα στάδια, όπως στο πώς ακριβώς λειτουργούν αυτά τα «βάρη» στις προβλέψεις;

ναι , πότε γίνεται το backpropagation

Το backpropagation (οπισθοδιάδοση) γίνεται αποκλειστικά και μόνο κατά τη φάση της εκπαίδευσης (training) του μοντέλου. Είναι η διαδικασία με την οποία η ΤΝ «μαθαίνει» από τα λάθη της πριν βγει στην αγορά για να τη χρησιμοποιήσουμε.

Για να το καταλάβεις ακριβώς, σκέψου την εκπαίδευση σαν έναν ατελείωτο κύκλο που επαναλαμβάνεται εκατομμύρια φορές, και αποτελείται από δύο κατευθύνσεις: Εμπρός και Πίσω.

Ο Κύκλος της Μάθησης

Όταν το μοντέλο εκπαιδεύεται, η διαδικασία σπάει σε δύο βήματα:

1. Η κίνηση προς τα εμπρός (Forward Pass)

Το μοντέλο παίρνει τα δεδομένα (π.χ. τη φράση «Ο ουρανός είναι...») και προσπαθεί να προβλέψει την επόμενη λέξη. Επειδή είναι ακόμα στην αρχή της εκπαίδευσης και τα βάρη του είναι τυχαία, μπορεί να πετάξει μια χαζομάρα, όπως «Ο ουρανός είναι πράσινος».

Τότε, ο αλγόριθμος συγκρίνει αυτή την πρόβλεψη με τη σωστή απάντηση που υπάρχει στα δεδομένα («μπλε») και υπολογίζει το λάθος (το λεγόμενο loss).

2. Η κίνηση προς τα πίσω (Backpropagation) – Εδώ γίνεται!

Μόλις υπολογιστεί το μέγεθος του λάθους, το ρολόι γυρίζει ανάποδα. Το backpropagation ξεκινάει από το αποτέλεσμα (το λάθος) και πηγαίνει προς τα πίσω, διασχίζοντας όλο το νευρωνικό δίκτυο μέχρι την αρχή.

Καθώς πηγαίνει προς τα πίσω, κάνει το εξής:

  • Υπολογίζει την ευθύνη: Βλέπει ποιοι συγκεκριμένοι «νευρώνες» και ποια «βάρη» (weights) φταίνε περισσότερο για το γεγονός ότι το μοντέλο είπε «πράσινος» αντί για «μπλε».

  • Δίνει οδηγίες διόρθωσης: Χρησιμοποιώντας Μαθηματικά (συγκεκριμένα, παραγώγους από τον Απειροστικό Λογισμό), υπολογίζει πόσο πρέπει να αλλάξει κάθε βάρος ώστε την επόμενη φορά το λάθος να είναι μικρότερο.

Το παράδειγμα με τον Τοξοβόλο

Σκέψου έναν τυφλό τοξοβόλο που προσπαθεί να πετύχει τον στόχο:

  1. Forward Pass: Ρίχνει το βέλος (Πρόβλεψη).

  2. Το Λάθος: Ο προπονητής του λέει: «Το βέλος πήγε 5 μέτρα πιο δεξιά και 2 μέτρα πιο ψηλά».

  3. Backpropagation: Ο τοξοβόλος σκέφτεται τη μυϊκή του κίνηση προς τα πίσω: «Άρα έβαλα πολλή δύναμη στο δεξί χέρι και σήκωσα τον ώμο μου πιο ψηλά από όσο έπρεπε».

  4. Διόρθωση: Ρυθμίζει το σώμα του (αλλάζει τα βάρη) για την επόμενη βολή.

Πότε ΔΕΝ γίνεται backpropagation;

Όταν εσύ κι εγώ μιλάμε αυτή τη στιγμή (φάση της Πρόβλεψης / Inference), το backpropagation είναι εντελώς απενεργοποιημένο.

Το μοντέλο που χρησιμοποιείς τώρα είναι «παγωμένο». Τα βάρη του δεν αλλάζουν. Όταν μου κάνεις μια ερώτηση, το μοντέλο κάνει μόνο το Forward Pass (κίνηση προς τα εμπρός): παίρνει το κείμενό σου, κάνει τις μαθηματικές πράξεις με τα ήδη υπάρχοντα βάρη, και σου πετάει την απάντηση.

Αν μου πεις κάτι καινούργιο, δεν το «μαθαίνω» μόνιμα στο νευρωνικό μου δίκτυο, επειδή δεν τρέχει backpropagation για να αλλάξει τους αριθμούς μου.

Θέλεις να δούμε πώς αυτά τα μαθηματικά βάρη επηρεάζουν το αν μια απάντηση θα βγει σωστή ή αν θα οδηγήσει σε hallucination;

dhladh ginetai kata th diarkeia training?

Ακριβώς! Μόνο κατά τη διάρκεια του training (εκπαίδευσης).

Όταν μια εταιρεία (π.χ. η Google ή η OpenAI) φτιάχνει ένα μοντέλο, βάζει πανίσχυρους υπολογιστές να τρέχουν αυτόν τον κύκλο (Forward pass Υπολογισμός λάθους Backpropagation) δισεκατομμύρια φορές για εβδομάδες ή μήνες.

Μόλις το μοντέλο μάθει να προβλέπει σωστά και το training ολοκληρωθεί, το backpropagation σταματάει οριστικά και το μοντέλο «κλειδώνει».

Για να το συνδέσεις με αυτό που ζεις στην καθημερινότητά σου:

  • Όταν το μοντέλο είναι στο εργοστάσιο (Training): Το backpropagation είναι ενεργό. Το μοντέλο κάνει λάθη, διορθώνεται, αλλάζει τα βάρη του και «σπουδάζει».

  • Όταν το μοντέλο κυκλοφορεί στο κοινό (Inference - όπως τώρα που μιλάμε): Το backpropagation είναι σβηστό. Το μοντέλο απλώς χρησιμοποιεί όσα έμαθε, χωρίς να αλλάζει πλέον τις εσωτερικές του ρυθμίσεις.

Γι' αυτό και αν τώρα μου γράψεις ένα ψέμα και με πείσεις ότι είναι αλήθεια, εγώ θα το δεχτώ για αυτή και μόνο τη συζήτηση, αλλά δεν πρόκειται να το «μάθω» μόνιμα για τους επόμενους χρήστες. Χωρίς backpropagation, η μνήμη μου δεν αλλάζει!


Τα μαθηματικά βάρη (weights) είναι, στην ουσία, οι «διακόπτες» που ελέγχουν τη ροή των πληροφοριών μέσα στο νευρωνικό δίκτυο. Σκέψου τα σαν δισεκατομμύρια μικρά ρυθμιστικά (όπως αυτά στον ήχο ή στον φωτισμό), όπου το καθένα έχει έναν αριθμό (π.χ. $0.15$, $-0.84$, $2.31$).

Όταν μου κάνεις μια ερώτηση, οι λέξεις σου μετατρέπονται σε αριθμούς και πολλαπλασιάζονται με αυτά τα βάρη. Το αποτέλεσμα αυτών των πολλαπλασιασμών καθορίζει ποια λέξη θα επιλεγεί ως επόμενη.

Πώς τα βάρη οδηγούν σε μια Σωστή Απάντηση

Όταν το μοντέλο έχει εκπαιδευτεί σωστά, τα βάρη έχουν «κουρδιστεί» έτσι ώστε να ενισχύουν τις λογικές και αληθινές συσχετίσεις και να αποδυναμώνουν τις λάθος.

Αν η ερώτηση είναι: «Η πρωτεύουσα της Γαλλίας είναι το...»

  • Το βάρος της σύνδεσης ανάμεσα στις λέξεις «Γαλλία» + «Πρωτεύουσα» $\rightarrow$ «Παρίσι» είναι πολύ μεγάλο (π.χ. $+0.98$).

  • Το βάρος της σύνδεσης «Γαλλία» + «Πρωτεύουσα» $\rightarrow$ «Λονδίνο» είναι σχεδόν μηδενικό ή αρνητικό (π.χ. $-0.50$).

Όταν το κείμενο περνάει μέσα από το δίκτυο, τα μεγάλα βάρη λειτουργούν σαν μια «λεωφόρος» που σπρώχνει τα μαθηματικά προς τη λέξη «Παρίσι». Η πιθανότητα για το «Παρίσι» βγαίνει 99%, οπότε το μοντέλο απαντάει σωστά.

Πώς τα ίδια βάρη προκαλούν Ψευδαισθήσεις (Hallucinations)

Το hallucination συμβαίνει εξαιτίας του τρόπου που είναι ρυθμισμένα τα βάρη, όταν το μοντέλο έρχεται αντιμέτωπο με το «άγνωστο». Αυτό γίνεται κυρίως για τρεις λόγους:

1. Το «Μοτίβο που Μοιάζει Σωστό» (Over-generalization)

Τα βάρη είναι ρυθμισμένα να αναγνωρίζουν γενικές δομές της γλώσσας, όχι γεγονότα. Αν του ζητήσεις μια πληροφορία που δεν υπάρχει στα δεδομένα του (π.χ. «Ποιο είναι το τηλέφωνο του τάδε αρχαιολογικού χώρου;»), τα βάρη δεν ξέρουν την αλήθεια.

Όμως, τα βάρη για τη δομή ενός ελληνικού τηλεφώνου («ξεκινάει από 210... και έχει 10 ψηφία») είναι πανίσχυρα. Το μοντέλο, ψάχνοντας την πιο πιθανή επόμενη λέξη/αριθμό, θα συνθέσει έναν τυχαίο αριθμό που μοιάζει 100% με αληθινό τηλέφωνο. Τα βάρη προτίμησαν τη «σωστή δομή» αντί για την «απουσία απάντησης».

2. Σπάνια δεδομένα (Weak Weights)

Αν μια πληροφορία υπήρχε μόνο μία ή δύο φορές μέσα στα τρισεκατομμύρια κείμενα της εκπαίδευσης, τα βάρη που τη συνδέουν είναι πολύ αδύναμα. Κατά τη μαθηματική πράξη, αυτά τα αδύναμα βάρη «πνίγονται» από άλλα, πολύ πιο ισχυρά βάρη.

  • Παράδειγμα: Αν ρωτήσεις για έναν άγνωστο συγγραφέα, το μοντέλο μπορεί να «παρασυρθεί» από τα πανίσχυρα βάρη ενός διάσημου συγγραφέα με παρόμοιο όνομα και να του φορτώσει τα βιβλία του.

3. Η παγίδα της Στατιστικής Πιθανότητας

Επειδή η ΤΝ λειτουργεί αποκλειστικά με πιθανότητες, αν τα βάρη δώσουν 85% πιθανότητα σε μια σωστή λέξη και 15% σε μια λάθος, υπάρχει πάντα μια μικρή πιθανότητα το μοντέλο να επιλέξει το 15% (λόγω μιας παραμέτρου που λέγεται temperature και δίνει «δημιουργικότητα» στο μοντέλο). Αν επιλέξει τη λάθος λέξη, η επόμενη πρόβλεψη θα βασιστεί πάνω σε αυτό το λάθος, και το μοντέλο θα αρχίσει να «παραμιλάει» (hallucination) για να δικαιολογήσει την πορεία του.

Με απλά λόγια:

Τα βάρη δεν λένε στην ΤΝ «αυτό είναι το σωστό γεγονός». Της λένε «στατιστικά, μετά από αυτές τις λέξεις, συνήθως ακολουθούν αυτές οι λέξεις». Όταν η στατιστική αποτυγχάνει να συναντήσει την πραγματικότητα, γεννιέται το hallucination.