Η δομή και η σύνταξη του HyperText Markup Langauge ή HTML , δεν λέει μόνο ένα πρόγραμμα περιήγησης στο Web πώς να εμφανίσετε τα περιεχόμενα ενός αρχείου , αλλά και καθορίζει τις διαρθρωτικές στοιχεία για το ίδιο το αρχείο . Αυτές οι ετικέτες είναι επίσης ανεκτίμητη, αν είστε ένας προγραμματιστής που κοιτάζουν για να φτιάξετε ένα πρόγραμμα που θα εξαλείψει συγκεκριμένα τμήματα ενός αρχείου HTML , όπως κεφαλίδα και το υποσέλιδο της . HTML Ανατομία
Η
HTML χρησιμοποιεί ένα απλό σύστημα επισήμανσης ετικετών για τον εντοπισμό διαφορετικά τμήματα ενός εγγράφου HTML . Κεφαλίδα του αρχείου HTML είναι χαρακτηρίζεται από την «
" ετικέτα , το υποσέλιδο από την ετικέτα
. Ένας αναγνώστης HTML θα ερμηνεύσει οτιδήποτε μεταξύ της ετικέτας ανοίγματος και την ετικέτα που δείχνει κλείσιμο του τμήματος , " < /header " > με " < /footer > , " ως μέρος της ενδεικνυόμενης τμήματος . Άλλες ετικέτες , όπως " " αντιστοιχούν σε άλλα στοιχεία του φακέλου . Εικόνων Προσδιορισμός Κεφαλίδες και υποσέλιδα Η Όταν δημιουργείτε κώδικα για να αφαιρέσει μακριά κεφαλίδες και τα υποσέλιδα HTML , δεν μπορείτε να βασιστείτε για να γνωρίζει ακριβώς πόσο καιρό η κεφαλίδα ή το υποσέλιδο θα είναι . Ενώ μερικοί κεφαλίδες και υποσέλιδα αποτελούνται από μια ενιαία γραμμή , θα μπορούσε να είναι πολύ μεγαλύτερο . Συνεπώς , ο κώδικας δεν μπορεί απλά αναζήτηση για το " / " ετικέτα , τότε το σύμβολο '\\ n' που δείχνει το τέλος μιας γραμμής . Όταν διαβάσετε το περιεχόμενο του αρχείου HTML είναι σε μια σειρά χαρακτήρων, θα πρέπει να προσδιορίσει τη θέση του δείκτη του πρώτου " < " της αρχικής ετικέτας καθώς και το "> " του τερματικού ετικέτα . < Br > εικόνων Εντοπισμός String Θέσεις Η δύο γλώσσες χαμηλού επιπέδου όπως η C και C υψηλού επιπέδου γλώσσες όπως Python και Ruby + + και έχουν μεθόδους για να σας βοηθήσει να εντοπίσετε τα στοιχεία του κειμένου μέσα σε ένα δεδομένο κορδόνι . Αυτές οι μέθοδοι θα επιστρέψει τη θέση του δείκτη του πρώτου χαρακτήρα του κειμένου που σας ενδιαφέρει . Όταν ζητάτε από τις αρχικές ετικέτες , αυτό θα σας δώσει το σημείο εκκίνησης για την αφαίρεση κειμένου . Όταν ψάχνετε το τερματικό ετικέτα , να θυμάστε ότι το σημείο που θέλετε είναι είτε έξι ( " < /head> " ) ή επτά ( " < /footer > " ) θέσεις μπροστά από τον αριθμό η μέθοδος παρέχει σας . εικόνων Διαγράμμιση Κωδικός Η
Μόλις έχετε τις θέσεις του δείκτη για την κεφαλίδα ή το υποσέλιδο τμήμα που θέλετε να καταργήσετε , μπορείτε να πάτε για να κάνει αυτό σε μία από τις δύο γενικές τρόπους . Η μία είναι να επικαλεσθεί τις κατάλληλες μεθόδους για να διαγράψετε τους χαρακτήρες μεταξύ του πρώτου και του τελευταίου δείκτη για το τμήμα . Αυτό θα τροποποιήσει άμεσα την αρχική σειρά . Μπορείτε επίσης να δημιουργήσετε μια νέα σειρά για τη δημιουργία δύο εκδόσεις του περιεχομένου του αρχείου HTML : το αρχικό αρχείο και μια έκδοση απογυμνωθεί από την κεφαλίδα και το υποσέλιδο κώδικα . Κάνετε αυτό με την απόδοση του περιεχομένου της αρχικής συμβολοσειράς μέχρι την αρχική θέση του δείκτη , και στη συνέχεια τα πάντα μετά την τελευταία θέση του δείκτη , με το νέο κορδόνι . Η εικόνων