1. ИКТ‎ > ‎

01. Логичка структура текстуалног документа и генерисање прегледа садржаја


Текст или документ је "информација намењена људском споразумевању која може бити приказана у дводимензионалном облику... 
Текст се састоји од графичких елемената као што су карактери, геометријски или фотографски елементи или њихове комбинације, који чине садржај документа." 
(ИСО-дефиниција).
У сваком тексту се разликују две основне формалне структуре:
  • логичка структура или логички изглед (енгл. logical layout) описује организацију садржаја текста.
    Типични елементи логичке структуре су јединице као што су наслови или, пак, пасуси.
  • графичка структура или графичка изглед (енгл. graphical layout) описује организацију текста у "штампаном" облику.
    Типични елементи графичке структуре су јединице као што су страна или ред.
Логичка структура не зависи од графичке структуре документа.

Основни појмови о хипертекстуалном документу

Хипертекст или веб документ је, поједностављено, текст који садрже везе или упутнице (енгл. link) ка другим документима или на самог себе.

Хипертекст је, прецизније, скуп страница (енгл. page) у облику датотека, међусобно повезаних упутницама које су уметнуте у странице. Ове упутнице се обично виде као везе (хипервезе) на које се може кликнути (од енгл. то цлицк). 

За разлику од обичног текста, који се чита линеарно (слева на десно, одозго наниже), хипертекст се чита пратећи хипер-везе у тексту, дакле, не нужно на линеаран начин.

Језици за описивање текста су језици који омогућавају да се прецизно опише изглед и садржај једног текста. Од посебног су значаја:

– SGML (скр. од Standard General Markup Language),

– TeX и LaTeX (за математичке текстове),

– PostScript (језик ласерских штампача),

– RTF (скр. од Rich Text Format), ...

Језици за описивање хипертекста су језици који омогу ћавају да се прецизно опише хипертекстуелна структура једног текста (упутнице на друге текстове, итд). Најзначајнији језици ове врсте су: 
  • SGML,
  • HTML (скр. од HyperText Markup Language), поједностављена верзија SGMLa,
  • XHTML (skr. od Expandable HTML) i
  • XML (скр. од Extensible Markup Language, "компромис" између претеране сложености SGML-а и једноставности HTML-а; његова стандардизација је у току).
Comments