Όσοι Μπλόγκερς επιθυμείτε να αναδημοσιεύσετε άρθρα από το RC-CAFE ,κάνετε το χωρίς να μας ρωτάτε.
Mοναδική παράκληση μας είναι να κάνετε μια αναφορά για την πηγή σας, εάν το επιθυμείτε, με ένα ενεργό link.

Τετάρτη, 22 Δεκεμβρίου 2010

Ψηφιακό ταξίδι πίσω από τις λέξεις 5,2 εκατ. βιβλία στο µικροσκόπιο της Google ,


Ενα ψηφιακό παράθυρο στην ιστορία των δύο τελευταίων αιώνων για ερευνητές αλλά και απλούς χρήστες του ∆ιαδικτύου άνοιξε από χθες η Google, καθώς ολοκληρώθηκε το τιτάνιο έργο της ψηφιοποίησης 500 δισεκατοµµυρίων λέξεων που περιέχονται σε 5,2 εκατοµµύρια τίτλους βιβλίων.
«Ο “Θεός” δενπέθανε, αλλά είναι βέβαιο ότι χρειάζεται έναν καλό επικοινωνιολόγο». Αυτή είναι µία από τις πολλές διαπιστώσεις στις οποίες κατέληξαν οι ερευνητές του Πανεπιστηµίου του Χάρβαρντ µετρώντας τη συχνότητα εµφάνισης της λέξης «Θεός» στα βιβλία που έχουν εκδοθεί από το1800 έως το 2000. Γράφοντας τη λέξη στην ιστοσελίδα http://ngrams.

googlelabs.com και µε ένα κλικ στο ποντίκι τους, οι αµερικανοί ερευνητές διαπίστωσαν ότι η χρήση της λέξης «Θεός» παρουσιάζει µια σταθερή συχνότητα, χωρίς όµως να «απογειωθεί» ποτέ. Εντελώς αντίθετη είναι η πορεία της λέξης «σεξ». Η σεξουαλική επανάσταση της δεκαετίας του 1960 αλλά και η γυναικεία χειραφέτηση αποτυπώνονται εµφανώς στη συχνότητα της λέξης στα βιβλία.

Οταν το 2003 η Google ανακοίνωσε την απόφασή τηςνα προχωρήσει στην ψηφιοποίηση αυτού του τεράστιου όγκου τίτλων και λέξεων, πολλοί έσπευσαν να προδικάσουν την αποτυχίατου εγχειρήµατος. Επτάχρόνια αργότερα, το τιτάνιο έργο ολοκληρώθηκε και οι Κασσάνδρεςδιαψεύστηκαν. Οπως και το Google Earth, ένα από τα πλέον δηµοφιλή «παιδιά» της µεγαλύτερης µηχανής αναζήτησης στον κόσµο, έτσι και η υπηρεσία ngrams.googlelabs. com παρέχεται δωρεάν στους χρήστες του ∆ιαδικτύου. Μέχρι στιγµής στη βάση δεδοµένων του περιέχονται 5,2 εκατοµµύρια τίτλοι. Τα βιβλία που ψηφιοποιήθηκαν είναι γραµµένα στα αγγλικά, τα γαλλικά, τα γερµανικά, τα ρωσικά, τα κινεζικά, τα ισπανικά και τα εβραϊκά.

Στις λέξεις, η µερίδα του λέοντος ανήκει στα αγγλικά µε 361 δισεκατοµµύρια και ακολουθούν τα γαλλικά και τα ισπανικά (45 δισ.), τα γερµανικά (37 δισ.), ταρωσικά (35 δισ.), τα κινεζικά (13 δισ.) και τα εβραϊκά (2 δισ.)
.

«Είναι πρωτοφανές», δηλώνει στην εφηµερίδα «Λε Φιγκαρό» ο καθηγητής ΓλωσσολογίαςΖαν Βερονί. «Οτανοι Βρετανοί ψηφιοποίησαν περίπου χίλιες λέξεις το 1980, θεωρήθηκε επανάσταση. Με την Google µιλάµε για µια εντελώς διαφορετική τάξη µεγέθους. Εάν γράφαµε όλες αυτές τις λέξεις τη µία πίσω από την άλλη, θα καλύπταµε την απόσταση από τη Γη στη Σελήνη είκοσι φορές», προσθέτει.

Στο Χάρβαρντ
Επικεφαλής της επιστηµονικής οµάδας του Χάρβαρντ που ανέλαβε να φέρει εις πέρας το εγχείρηµα πριν από επτά χρόνια είναιο 28χρονος Γάλλος Ζαν Μπατίστ Μισέλκαι ο Ερέζ Λίµπερµαν Αϊντεν, αµερικανός µαθηµατικός, φυσικός και φιλόσοφος. Η οµάδα εργάστηκε µε απόλυτη µυστικότητα, καθόρισε τους αλγόριθµους και τους πίνακες συχνότητας που επιτρέπουν την καταγραφή όλων των λέξεων που περιέχονται στα ψηφιοποιηµένα βιβλία, αποκρυπτογραφώντας στην ουσία δύο αιώνες εξέλιξης στην κοινωνία και τον πολιτισµό. Για να αποφύγουν ενδεχόµενες επιπλοκές µε τα πνευµατικά δικαιώµατα, οι ερευνητές έπρεπε να στερήσουν τις λέξεις από το περιεχόµενό τους, να τις συρρικνώσουν στο πιο απλό τους νόηµα.

Οι λέξεις αυξάνονται συνεχώς
Ενα από τα συµπεράσµατα στα οποία κατέληξαν είναι ότι οι λέξεις δεν έπαψαν να αυξάνονται από το 1900. Εκείνητη χρονιά καταγράφηκαν 544.000 λέξεις, το 1950 έφτασαν τις 597.000, για να ξεπεράσουν το 2000 το ένα εκατοµµύριο.

Οπως είναι φυσικό, τα λεξικά δεν µπόρεσαν να παρακολουθήσουν αυτή την εξέλιξη. Είναι χαρακτηριστικό ότι το 52% των λέξεων που χρησιµοποιούνται στα βιβλία το 2000 δεν υπάρχουν ως λήµµατα στα δυοβασικά λεξικά της αγγλικής γλώσσας που κυκλοφορούν στις Ηνωµένες Πολιτείες. Το ίδιο ισχύεικαι για τηβρετανική εγκυκλοπαίδεια Britannica.

Η ΙΣΤΟΡΙΑ ΤΩΝ ΛΕΞΕΩΝ

Η συχνότητα εµφάνισης των λέξεων αντικατοπτρίζει την ιστορία δύο αιώνων


Στο µέλλον θα δικαιούµαστε... 7½ λεπτά δηµοσιότητας

ΑΡΚΕΙ ΠΛΕΟΝ ένα κλικ για να δει κανείς πως οι «γυναίκες» µνηµονεύονται ελάχιστα σε σχέση µε τους «άνδρες» έως τη δεκαετία του 1960 και ότιαυτή η τάση άλλαξε όσο δυνάµωνε το κίνηµατουφεµινισµού. Τα δύο φύλαδιασταυρώθηκαν για πρώτη φορά το 1986, χρονιά που η συχνότητα εµφάνισης της λέξης «γυναίκες» ισοφάρισε τη συχνότητα εµφάνισης της λέξης «άνδρες». Από τότε το «ασθενές φύλο» προηγείται σταθερά. Ενδιαφέρον έχει επίσης το γεγονός ότιµερικά από τα µεγαλύτερα είδωλα της ποπ κουλτούρας, όπως ο Μίκι Μάουςκαι η Μέριλιν Μονρόε, απασχολούν πολύ λιγότερο τους συγγραφείς απ’ό,τι αµερικανοί πρόεδροι που διακρίθηκαν ιδιαίτερα για την προεδρία τους, όπως ο Τζίµι Κάρτερ.

Ορισµένα χρήσιµα συµπεράσµατα εξάγονται και από το γεγονός ότι η «πλατεία Τιενανµέν» έχει συντριπτικά περισσότερες αναφορές στα αγγλικά σε σχέση µε τα κινέζικα ή πως οι κλασικοί της αρχαιότητας χάνουν συνεχώς έδαφος µε τον Πλάτωνα πάντως να εµφανίζεται ως ο πλέον δηµοφιλής. Ενα από τα πιο αξιοσηµείωτα συµπεράσµατα είναι πόσο έχει µειωθεί η διάρκεια της φήµης. Η οµάδα του Χάρβαρντ διαπίστωσε ότι στα µέσατου 20ού αιώνα η δόξα που απολάµβανε ένα πρόσωποέσβηνε 2,5 φορές πιογρήγορα σε σχέση µε τις αρχέςτου 19ου αιώνα. «Στο µέλλον ο καθένας θα είναι διάσηµος για 7½ λεπτά»,δήλωσε ο Ερέζ Λίµπερµαν Αϊντεν στους «Νιου Γιορκ Τάιµς». Ούτε καν τα δεκαπέντε λεπτά του Αντι Γουόρχολ.


Αναδημοσιευση Απο Νεα

Δεν υπάρχουν σχόλια:

Όσοι Μπλόγκερς επιθυμείτε να αναδημοσιεύσετε άρθρα από το RC-CAFE ,κάνετε το χωρίς να μας ρωτάτε.
Μονο μην ξεχνάτε να κάνετε μια αναφορά για την πηγή σας, εάν το επιθυμείτε , με ένα ενεργό link.
Link directory