changelog.png
site-map.png
rss.png

Χαρακτήρες μισού/πλήρους πλάτους

Στους υπολογιστές για τις γλώσσες CJK (Chinese, Japanese και Korean), οι γραφικοί χαρακτήρες χωρίζονται παραδοσιακά σε πλήρους και μισού πλάτους χαρακτήρες. Στις γραμματοσειρές σταθερού πλάτους, οι χαρακτήρες αυτοί καταλαμβάνουν ολόκληρο ή το μισό του πλάτους ενός κανονικού χαρακτήρα, εξ ου και το όνομά τους.

Την εποχή που οι υπολογιστές χρησιμοποιούσαν τερματικά κειμένου, οι χαρακτήρες εμφανίζονταν σε ένα πλαίσιο, που περιείχε 80 στήλες και 24 ή 25 γραμμές. Κάθε χαρακτήρας εμφανίζονταν ως ένα μικρό dot matrix, με συνηθέστερο πλάτος 8 εικονοστοιχείων, ενώ για την κωδικοποίηση των δυτικών γλωσσών χρησιμοποιούνταν το λεγόμενο SBCS (single byte character set).

Στο Unicode, αν ένας συγκεκριμένος στοιχείο ενός αλφαβήτου μπορεί να εμφανιστεί με πλάτος ίσο με αυτό ενός χαρακτήρα ή με το μισό αυτού, λέμε ότι έχει δύο τύπους: έναν τύπο πλήρους πλάτους και έναν τύπο μισού πλάτους.

Με τον όρο Τύποι μισού/πλήρους πλάτους εννοούμε ένα Unicode block U+FF00–FFEF, το τελευταίο του Basic Multilingual Plane μη συμπεριλαμβανομένου του short Specials block στο U+FFF0–FFFF.

Πηγή: Wikipedia

Ποια η χρήση τους στο AncientGreek; ^

Οι ιστορικές κωδικοποιήσεις των Αρχαίων Ελληνικών (όπως οι Beta Code και SPIonic) χρησιμοποιούν χαρακτήρες ASCII (Αγγλικά γράμματα, σημία στίξης, κλπ.) για την αναπαράσταση αρχαίου Ελληνικού κειμένου. Επιπλέον, η SPIonic χρησιμοποιεί τους αριθμούς (0-9) για την αναπαράσταση τόνων και πνευμάτων. Αυτό σημαίνει ότι έγγραφα γραμμένα σε οποιαδήποτε από αυτές τις κωδικοποιήσεις είναι αδύνατον να περιέχουν Αγγλικό κείμενο (ή κείμενο που χρησιμοποιεί χαρακτήρες ASCII), επειδή αυτό θα εκλαμβάνονταν ως αρχαίο Ελληνικό κείμενο.

Το πρόβλημα εμφανίζεται ακόμα πιο έντονα κατά την μετατροπή κειμένου Unicode σε οποιαδήποτε από αυτές τις κωδικοποιήσεις, αφού συχνά υπάρχουν σε αυτό χαρακτήρες ASCII (για παράδειγμα το όνομα του συντάκτη). Η μετατροπή ενός τέτοιου κειμένου θα καθιστούσε το Αγγλικό κείμενο μη αναγνώσιμο.

Η μόνη λύση είναι να "μεταμφιεστούν" οι χαρακτήρες ASCII (το Αγγλικό κείμενο) έτσι ώστε να μην αλλαχτούν κατά την μετατροπή. Εδώ είναι που μπαίνουν οι χαρακτήρες μισού-διπλού πλάτους. Μετατρέποντας τους χαρακτήρες ASCII (το Αγγλικό κείμενο) σε χαρακτήρες μισού-διπλού πλάτους πριν την μετατροπή του αρχαίου Ελληνικού κειμένου σε Beta Code ή SPIonic (ή σε οποιαδήποτε άλλη ιστορική κωδικοποίηση), θα τους διατηρήσει σε μία μορφή που εξακολουθούν να είναι αναγνώσιμοι, όπως μπορείτε να δείτε στην εικόνα που ακολουθεί.

fullwidth-text-ok.jpg

Η πρώτη γραμμή είναι γραμμένη με κανονικούς (ASCII) χαρακτήρες, ενώ η δεύτερη έχει μετατραπεί σε χαρακτήρες μισού/πλήρους πλάτους.

Ποιες γραμματοσειρές να χρησιμοποιήσετε ^

Όταν το LibreOffice / OpenOffice εντοπίσει κείμενο με χαρακτήρες μισού-διπλού πλάτους, θα προσπαθήσει να βρει μια γραμματοσειρά που θα μπορούσε να τους εμφανίσει σωστά. Το αν θα το καταφέρει εξαρτάται από τις γραμματοσειρές που είναι εγκατεστημένες στο σύστημα.

Αν επιτύχει, τότε θα πάρουμε κάτι σαν αυτό που φαίνεται στην προηγούμενη εικόνα. Αν όχι, θα πάρουμε κάτι σαν αυτό:

fullwidth-text-nok.jpg

Σε αυτήν την περίπτωση, θα πρέπει να εγκαταστήσετε μία κατάλληλη γραμματοσειρά.

Για παράδειγμα, η εξ ορισμού εγκατάσταση ενός συστήματος Debian Linux δεν περιλαμβάνει καμία κατάλληλη γραμματοσειρά. Η αναζήτηση των όρων "CJK" και "font" επιστρέφει το πακέτο "ttf-wqy-zenhei". Μετά την εγκατάστασή της και την επανεκκίνηση του LibreOffice / OpenOffice το πρόβλημα θα έχει λυθεί.

Ο παρακάτω πίνακας εμφανίζει την διαθεσιμότητα των γραμματοσειρών CJK στα Λειτουργικά Συστήματα που υποστηρίζονται από το AncientGreek.

Λ.Σ. Όνομα γραμματοσειράς Λειτουργεί με
Windows XP SP3 Arial Unicode MS Χειροκίνητη εγκατάσταση
Windows 7-8-8.1/10 SimSun/Source Han Sans CN Regular Αυτόματα
Debian Linux WenQuanYi Zen Hei Χειροκίνητη εγκατάσταση
Debian sid AR PL SungtiL GB Χειροκίνητη εγκατάσταση
Mac OS Arial Unicode MS Αυτόματα

Πώς λειτουργεί ^

Όπως έχει ειπωθεί παραπάνω, οι χαρακτήρες μισού/πλήρους πλάτους είναι χρήσιμοι κατά την μετατροπή κειμένου Unicode σε μία ιστορική κωδικοποίηση (Beta Code, SPIonic, κλπ.).

Το προς μετατροπή κείμενο ελέγχεται για την ύπαρξη χαρακτήρων ASCII (Αγγλικού κεμένου) και αν βρεθούν τέτοιοι χαρακτήρες μετατρέπονται σε χαρακτήρες μισού/πλήρους πλάτους. Στη συνέχεια θα εκτελεστεί η μετατροπή του κειμένου στην επιλεγμένη ιστορική κωδικοποίηση.

Όταν γίνεται μετατροπή από κάποια ιστορική κωδικοποίηση σε Unicode, θα πραγματοποιηθεί μία επιπλέον μετατροπή μετά την κύρια μετατροπή· όλοι οι χαρακτήρες μισού/πλήρους πλάτους θα μετατραπούν αυτόματα σε Unicode.

Ο διάλογος μετατροπής Χαρακτήρων μισού/πλήρους πλάτους ^

Το AncientGreek παρέχει τη δυνατότητα χειροκίνητης μετατροπής χαρακτήρων ASCII σε χαρακτήρες μισού/πλήρους πλάτους (και αντίστροφα), μέσω του σχετικού διαλόγου (που εμφανίζεται παρακάτω), ο οποίος μπορεί να εμφανιστεί από το "Μενού του AncientGreek / Ιστορικές κωδικοποιήσεις / Χαρακτήρες μισού/πλήρους πλάτους" ή με κλικ στο εικονίδιο hfw-16.png στη Βοηθητική εργαλειοθήκη.

half-full-convert.jpg
Ο διάλογος στο Debian Linux

Διαθέσιμες επιλογές:

Όταν ενεργοποιηθεί η επιλογή "Χαρακτήρες μισού/πλήρους πλάτους σε ASCII", θα εκτελεστεί η αντίστροφη μετατροπή. Αυτό δεν χρειάζεται όταν γίνεται κάποια μετατροπή από μια Ιστορική Κωδικοποίηση σε Unicode, αφού τότε η συγκεκριμένη μετατροπή εκτελείται αυτόματα.

×

Ειδοποίηση

Αν κάποιος πίνακας εμφανίζεται κομμένος, μπορείτε να δείτε όλα τα περιεχόμενά του με κύλιση προς τα δεξιά.