Glossar (im Entstehen)
Häufige Begriffe aus dem Bereich
"Elektronisches Publizieren".
A B
C D E F
G H I J
K L M N
O P Q R
S T U V
W X Y Z
- A -
Archivformat
– Im Gegensatz zur Archivierung von Schriftstücken
gibt es für die Archivierung (v.a. Langzeitarchivierung)
von digitalen Dokumenten noch keinen großen Erfahrungsschatz.
Doch auch, wenn es noch keinen gemeinsamen und getesteten Standard
gibt, werden die folgenden Aspekte inzwischen allgemein für
relevant erachtet: Es soll ein archvierbares Format entstehen,
das von einem unabhängigen, internationalen Gremium normiert
wird und das möglichst unabhängig von einem bestimmten
Betriebssystem ist. In das Format sollen andere Datentypen (wie
z.B. Bilder, Videos, Töne) integrierbar sein. Es soll eine
inhaltlich gebundene Recherche im Volltext und in den Metadaten
möglich sein und eine Konvertierbarkeit in andere Formate
(und damit eine möglichst freie Wahl der Präsentationsform,
die dem gegebenen Inhalt entspricht) muss ohne Datenverluste ermöglicht
werden. (s. in diesem Zusammenhang: OAI, DOI,
Metadaten, XML)
[top]
- B -
[top]
- C -
CGI
– Common Gateway Interface.
CGI ist eine Server-Schnittstelle, die die Ausführung von
Programmen/Scripts ermöglicht. Die häufigste Scriptsprache
für diese Schnittstelle ist Perl.
Compiler
– Ein Compiler ist eine Software, die Programmcode (s.Quellcode)
in Maschinensprache übersetzt und das Ergebnis in Programmdateien
abspeichert. Der Quellcode ist damit nicht mehr zugänglich
und muss – im Falle eines Open-Source
Projektes – separat bereitgestellt werden (zu beachten ist
der Unterschied zum Interpreter).
Content-Management-System
– (s. Redaktionssystem)
CSS
– Cascading Style-Sheets.
Das speziell für HTML entwickelte Stylesheet-Format
ist eine Ergänzungssprache, die ein beliebiges Formatieren
einzelner HTML-Elemente ermöglicht. Dies vereinfacht z.B.
in umfangreichen Web-Projekten eine einheitliche Formatierung
oder ist bei der Bereitstellung eines HTML-Dokumentes für
verschiedene Ausgabeformate (Bildschirm, Drucker, etc.) behilflich.
CSS ist eine normierte Sprache und wird vom W3C
gepflegt und weiterentwickelt (CSS-Seite
des W3C).
CVS
(-Server) – Concurrent
Versions System. CVS ist ein Versionskontrollsystem. Durch
die Verwendung können die Änderungen bzw. die Historie
einer Quelldatei aufgezeichnet werden. Dabei wird nicht für
jede Version eine eigene Datei angelegt, sondern CVS speichert
die Veränderungen immer in einer Datei. Ein CVS-Server ermöglicht
das gleichzeitige Arbeiten mehrerer Programmierer an einer Quelldatei.
Im "open-source"-Umfeld ist
CVS inzwischen Standard.
[top]
- D -
Datenbank
– In einer Datenbank werden Informationen (z.B. Adressen)
in der Form von Datensätzen – meist in Tabellen –
gespeichert. Einen Datensatz kann man sich als eine Zeile in der
Tabelle vorstellen. Die Tabellenspalten stellen Sortierkriterien
dar (Eine Adresse [also eine Zeile] besteht aus [den Spalten]
Name, Vorname, Strasse, Wohnort und kann entsprechend z.B. nach
Wohnort [alle Adressen in München] sortiert bzw. gefiltert
werden). Besondere Bedeutung haben die sogenannten "relationalen
Datenbanken". Eine relationale Datenbank speichert Daten
in separaten Tabellen und nicht in einem großen Speicherraum.
Die Tabellen werden durch definierte Beziehungen verbunden (Relationen).
Dies ermöglicht, Daten aus verschiedenen Tabellen auf Nachfrage
zu kombinieren. Beispiele für realtionale Datenbanken sind
Microsoft Access und MySQL.
DocBook
– DocBook ist eine Document Type Definition.
Ursprünglich wurde sie für Dokumente mit technischem
Inhalt erstellt. Inzwischen fand sie jedoch - v.a. wegen ihrer
Flexibilität - auch Einzug in andere Bereiche, wie z.B. literaturwissenschaftliche
Rezensionen, o.ä.
DOI
– Digital Object Identifier.
Ein DOI ist eine Zeichenkette, die ein Objekt eindeutig identifiziert.
Sie wird elektronischen Publikationen zugeordnet und identifiziert
diese eindeutig (vergleichbar mit der ISBN für Bücher).
DOI befindet sich derzeit in der zweiten Prototyp-Phase (Stand
02/2003) und soll zukünftig ein Standard im elektronischen
Publikationswesen werden. In Deutschland ist die
ISBN-Agentur für die Bundesrepublik Deutschland zuständig.
Mehr
Details...
DTD
– Document Type Definition.
Die DTD ist eine normative Definition z.B. von HTML in SGML
bzw. von XHTML in XML. Grundsätzlich beinhaltet
eine DTD die Informationen, die regeln welche Tags und Textelemente
es gibt, wann sie vorkommen dürfen (Kontextabhängigkeit),
welche Attribute erlaubt sind und in wie weit Tags und Daten innerhalb
eines Tags erlaubt sind. Auch andere auf SGML/XML basierende Dokumententypen
können durch eine DTD definiert werden. Das W3C
bestimmt mit Hilfe von DTDs die jeweiligen Versionen von HTML,
XML, etc. In den ersten Zeilen einer HTML-Datei
findet sich oft ein Verweis auf eine DTD (z.B. am Anfang dieses
Dokumentes: <!DOCTYPE HTML PUBLIC "-//W3C//DTD
HTML 4.01 Transitional//EN">).
DSSSL
– Document Style Semantics and
Specification Language (gesprochen "Dissel").
Genau genommen ist DSSSL mehr als nur die Definition einer layoutbeschreibenden
Sprache. Es ermöglicht komplexe Transformationsprozesse von
SGML-Daten. Zum einfacheren Verständnis
genügt es jedoch, sich DSSSL als Stylesheet-Format
von SGML vorzustellen. DSSSL ist der Vorläufer von XSL.
Dublin
Core – Dublin Core ist ein Metadatenformat
. In internationaler Zusammenarbeit ist ein Kernsatz von 15 Elementen
(Titel, Autor, Schlagwort, verwendete Dateiformate, etc...) entstanden,
die der Autor einer Publikation selbst vergibt. Damit sollen elektronische
Textobjekte im WWW schneller und leichter identifizierbar sein.
Mehr Details...
Dynamischer
Inhalt – Im Unterschied zum statischen Inhalt einer
"normalen" HTML-Seite werden die
gewünschten Informationen auf einer Web-Seite erst im Moment
der Anfrage zusammengestellt. Meist arbeitet im Hintergrund eine
Datenbank, aus der die Informationen
ausgelesen werden (z.B. werden bei einem Online-Telefonbuch die
gesuchten Nummern entsprechend der vorherigen Suchanfrage zusammengestellt).
[top]
- E -
Elektronisches
Publizieren – Unter elektronischen Publikationen
versteht man Veröffentlichungen, die zur Darstellung elektronische
Medien verwenden. Zu unterscheiden sind On- und Offline-Publikationen,
also solche, die das Internet nutzen (online) und solche, die
auf lokalen Datenträgern (CD-ROM, DVD, Diskette) veröffentlicht
werden.
E-Journal
– Electronic Journal.
Ein E-Journal ist eine elektronische Zeitschrift.
[top]
- F -
Framework
– Ein Framework ist ein Umfeld von Anwendungen (Programmen),
das auf bestimmte Bedürfnisse zugeschnitten werden kann.
FOP
– Formatting Object Processor.
FOP ist ein Teil des Apache
XML Projektes und ermöglicht
die Konvertierung von XML-Dokumenten in PDF.
(s.auch XSL-FO)
[top]
- G -
GNU
– (ausgesprochen wird es "Ge-NJUH") GNU ist eine
rekursive Abkürzung für GNU's
Not Unix. Dabei geht es um die Entwicklung eines unabhängigen,
Unix-ähnlichen Betriebssystems. Es gilt
auch wegen seiner Rechtsform (open source)
als vorbildhaft.Mehr
Details...
GNU
Eprints – GNU Eprints ist ein Programm zur Erstellung
von Online-Archiven. Es soll vor allem im wissenschaftlichen Umfeld
das schnellere Auffinden von Publikationen ermöglichen. Mehr
Details...
[top]
- H -
Harvester
– Erntemaschine (s.Suchmaschine)
HTML
– HyperText Markup Language.
Eine mittels SGML definierte Auszeichnungssprache,
die die logischen Bestandteile eines Dokumentes beschreibt. Entsprechend
werden typische Elemente eines Dokumentes (Überschriften,
Listen, Tabellen, etc.) markiert. HTML ist eine normierte Sprache
und wird vom W3C gepflegt und weiterentwickelt
(HTML-Seite
des W3C). Zur einheitlichen
Formatierung eines HTML-Dokumentes werden häufig Stylesheets
im CSS-Format verwendet.
[top]
- I -
Interpreter
– Eine Interpreter übersetzt
Programmcode (s. Quellcode) im Moment
der Ausführung in Maschinensprache.
So werden z.B. Java Scripts im Moment der Ausführung von
einem Interpreter im Browser übersetzt (zu beachten ist der
Unterschied zum Compiler).
[top]
- J -
[top]
- K -
[top]
- L -
[top]
- M -
Metadaten
– Metadaten sind strukturierte Daten, mit deren Hilfe eine
Informationsressource beschrieben und dadurch besser auffindbar
gemacht wird. Geliefert werden Grundinformationen über ein
Dokument (z.B. Autor, Titel, Ort/Datum der Veröffentlichung
s. DublinCore). Die Nähe zur bekannten
Erschließungsarbeit in Bibliotheken erklärt die besonderen
Bemühungen der Bibliotheken, einen Standard für Metadaten
auch für elektronische Publikationen zu schaffen. Mehr Informationen
bieten die SUB-Göttingen
und Die
Deutsche Bibliothek.
MySQL
– Wird "Mai Ess Ku Ell" ausgesprochen. Die populäre
Open-Source-Datenbank MySQL (hier
zur offiziellen Website) basiert auf SQL, der "Structured
Query Language" (strukturierte Abfragesprache), der
verbreitetsten standardisierten Sprache für Datenbankzugriffe.
Eine SQL-Datenbank hält in der Regel auf einem Server Informationen
bereit, die bei Bedarf abgefragt werden können und die meist
in HTML-Seiten eingebunden werden (man spricht
auch von "dynamischen Inhalten").
Häufig wird in Verbindung mit MySQL PHP
verwendet.
[top]
- N -
[top]
- O -
OAI
– Open Archives Initiative.
Auf der Basis des "Open
Archive Initiative Protocol
for Metadata Harvesting" können lokale Dokumenten- und
Multimedia-Serversysteme mit einer quasi normierten Schnittstelle
zum Austauch von Metadaten versehen werden.
Es soll ermöglicht werden, anhand von Metadaten in den Datenbeständen
renommierter wissenschaftlicher Dokumentenarchive zu recherchieren.
Online-Archiv
– Ein Online-Archiv liegt meist in Form einer Datenbank
vor, die bei entsprechender Suchanfrage archivierte Informationen
meist in Form von dynamischen
HTML-Seiten ausgibt. Wichtig in diesem Zusammenhang sind Metadaten,
OAI, DOI. (Mehr
Aspekte bei Netzspannung.org).
Open
Source – Der Quellcode einer
Open-Source-Software ist frei zugänglich (meist im Internet
auf den Entwicklerseiten verfügbar, oder auf dem Installationsmedium
vorhanden). Dieses – meist nicht-kommerzielle – Verfahren
ermöglicht es einer großen Software-Entwicklergemeinde
die Software entsprechend der jeweiligen Interessen zu verändern,
bzw. grundsätzlich zu verbessern. Weitere typische Merkmale
sind: eine kooperative Entwicklergemeinde und die kostenlose Programmverwendung.
Wichtige Veränderungen/Verbesserungen werden in den allgemeinzugänglichen
Quellcode übernommen und die Software erhält in der
Regel eine höhere Versionsnummer. Zur Versionskontrolle hat
sich das CVS-Server-System etabliert. Bekanntestes
Beispiel einer Open-Source-Software dürfte das Betriebssystem
Linux
sein.
[top]
- P -
Parser
– Ein Parser ist eine Software, die den (Quell-)Code
auf korrekte Syntax hin überprüft. Z.B. können
HTML-Dokumente beim W3C
mittels eines SGML-Parsers auf ihre Syntax
hin überprüft werden (zum
MarkUp Validation Service).
PDF
– Portable Document Format.
Das von der Firma Adobe
ins Leben gerufene Dateiformat PDF dient der Darstellung von Texten,
deren Formatierung durch den Leser nicht veränderbar ist.
Das macht PDF nicht nur für kommerzielle Publikationen (Handbücher,
Formulare, etc), sondern auch für wissenschaftliche Publikationen
– vor allem hinsichtlich des "Zitierproblems"
in elektronischen Dokumenten – interessant (feste Seitenumbrüche,
Grafik immer an gleicher Stelle, etc.). Es gibt zahlreiche, auch
kommerzielle Werkzeuge zur Erzeugung von PDF-Dateien. Der Standard
ist ausführlich und offen dokumentiert und es wird daran
gearbeitet, z.B. Konvertierungen aus XML zu
ermöglichen (s.FOP). Als problematisch
gilt der Verlust von Strukturinformationen im PDF, weshalb eine
Weiterverarbeitung eines PDFs nicht möglich ist.
Perl
– Practical Extraction
and Report Language. Genaugenommen handelt es sich bei
Perl um eine Scriptsprache, die häufig
auf Servern verwendet wird. Man kann sie
jedoch auch auf dem PC verwenden, besonders für die Manipulation
von Texten. Perl wird ähnlich wie PHP
oft in Verbindung mit einem Datenbanksystem (z.B. Oracle) oder
mit CGI verwendet. Mehr
Details...
PHP
– PHP: Hypertext Preprocessor.
Es handelt sich um eine serverseitige Open
Source Scriptsprache, die besonders
für die Webprogrammierung geeignet ist. PHP kann in HTML
eingebettet werden (im Unterschied zu Perl).
Trotz eines enormen Funktionsumfangs ist PHP vergleichsweise einfach
zu erlernen. Es findet häufig in Verbindung mit MySQL
Anwendung. Mehr
Details...
[top]
- Q -
Quellcode
– Der Quellcode ist der aus Befehlen, Abfragen und Ähnlichem
aufgebaute Programmcode einer Software. Von Quellcode spricht
man sowohl bei Auszeichnungssprachen (z.B. HTML),
als auch bei Scriptsprachen (z.B. PHP) und
höheren Programmiersprachen (z.B. C++). Der Quellcode bedarf
immer einer Übersetzung in Maschinensprache. Dies wird entweder
durch einen Compiler oder Interpreter
erledigt .
[top]
- R -
RDF
– Resource Description Framework.
RDF ist ein flexibles System (beruhend auf der Syntax von XML)
für die Codierung, den Austausch und die Wiederverwendung
von Metadaten. Es wird vom W3C
entwickelt und gepflegt und beinhaltet Entwicklungen wie z.B.
Dublin Core u.a. (zur
RDF-Seite des W3C).
Redaktionssystem
–
Relationale
Datenbank – (s.Datenbank)
Rendering
– "Übersetzung" oder "Übertragung"
RTF
– Rich Text Format. Ein
von Microsoft entwickeltes Dateiformat, das speziell für
den Austausch formatierter Texte zwischen verschiedenen Textverarbeitungsprogrammen
verwendet wird. Die Formatierungen bleiben dabei erhalten.
[top]
- S -
Semantic Web
– Das Semantic Web ist eine Vision von der Erweiterung des
Internets, um die im WWW verfügbaren Informationen mit für
Maschinen verarbeitbarer Semantik zu erweitern. Es handelt sich
dabei um eine offene, aktive und v.a. vom W3C
vorangetriebene Forschungsunternehmung, die im Zusammenhang mit
der Diskussion um Metadaten oder Schlagworte,
wie. z.B. RDF, XML, etc.
gesehen werden muß. (zur
Semantic-Web-Seite des W3C)
Server
– Ein Server ist ein spezieller Computer in einem Computernetzwerk.
Er zeichnet sich dadurch aus, dass er anderen Computern bestimmte
Leistungen zur Verfügung stellt. Beispielsweise gibt es Fileserver
(FTP), Mailserver, CVS-Server.
SGML
– Standard Generalized Markup
Language. SGML wurde bereits 1986 als ISO-Standard (ISO
8879) festgeschrieben und ist gewissermaßen die "Urmutter"
aller Auszeichnungssprachen (wie z.B. HTML).
Wegen seiner Komplexität ist SGML als "Alltagssprache"
eher nicht geeignet. In engem Zusammenhang mit SGML steht das
Format DSSSL.
Scriptsprache
– Ein Script besteht aus einer Liste von Befehlen, die ohne
Eingreifen eines Benutzers vom Computer abgearbeitet werden können.
Der Quellcode eines Scripts wird erst
unmittelbar bei dessen Verwendung interpretiert. Bekannte Scriptsprachen
sind: JavaScript, Perl oder PHP.
SQL
– Structured Query Language.
(s. MySQL)
Stylesheet
– Ein Stylesheet ist am ehesten mit einer Formatvorlage
zu vergleichen. Es interpretiert die zugewiesenen Daten (HTML,XML,
etc.) und formatiert sie (z.B. für die Bildschirmausgabe)
entsprechend der im Stylesheet vorgegebenen Regeln. Bekannte Stylesheetformate
sind CSS und XSL.
Suchmaschine
– Grundsätzlich sind Suchmaschinen Suchhilfen,
die einen oder mehrere Server nach bestimmten
Kriterien durchsuchen. Meist wird mit Hilfe von Datenbanken eine
Stichwort- oder Volltextsuche ermöglicht. Suchmaschinen werden
gelegentlich als "Spinnen im weltweiten Spinnennetz"
oder Erntemaschinen ("Harvester") bezeichnet.
[top]
- T -
Tag
TEI
[top]
- U -
Unix
– die rekursive Abkürzung:"UNIX
is Not multICS" (MULTICS
ist ein obsoletes Betriebssystem des MIT)
steht für ein Multitask- und Multiuser-Betriebssystem, das
Ende der 60er Jahre von den Bell Laboratories entwickelt wurde
und bis heute in verschiedenen Formen für leistungsstarke
Server-Rechner in einer Netzwerkumgebung
eingesetzt wird.
[top]
- V -
[top]
- W -
W3C
– World Wide Web Consortium.
Das W3C
wurde im Oktober 1994 gegründet. Es entwickelt einheitliche
Technologien (Spezifikationen, Richtlinien, Software und Tools),
die den Fortschritt des Webs fördern und Interoperabilität
sicherstellen sollen.
[top]
- X -
XHTML
– Extensible Hypertext
Markup Language. XHTML
ist eine Auszeichnungssprache für Web-Seiten, die vom W3C
gefördert und gepflegt wird. Sie entstand durch eine Neuformulierung
von HTML auf der Basis von XML.
Ziel dieser Entwicklung ist es, Inhalt, Struktur und Formatierung
eines Dokuments voneinander zu trennen (XHTML-Seite
des W3C).
XML
– Extensible Markup Language.
XML ist eine Metaauszeichnungssprache bzw. eine Regelsystem, um
Auszeichnungssprachen zu definieren. Es ist eine Teilmenge von
SGML, die so konzipiert ist, dass die damit
erstellten Regeln entweder explizit in einer DTD
formuliert werden (Alle Texte, die den Regeln ihrer DTD folgen
sind "valid", also gültig). Eine solche Überprüfung
geschieht mit einem Parser, oder die Texte
gehorchen lediglich den allgemeinen Bauregeln von XML-Dateien
(und gelten dann als "well-formed", "also wohlgeformt").
Inzwischen gibt es zahlreiche Auszeichnungssysteme für spezifische
Anwendungsgebiete, z.B. für das technische Publizieren DocBook,
oder für philologische Texte TEI. Die
Mächtigkeit (und das Problem) von XML liegt auch in den zahlreichen
Kostandards wie z.B. XSL, XML Query, XML Schema
usw.
XPath
–
XSL
– Extensible Stylsheet Language.
XSL (eine Ergänzungssprache zu XML) besteht
aus drei Sub-Standards: XSLT (Transformationssprache),
XSL-FO (Rendering
von XML-Dateien), XPath (Sprache, um auf
Teile von XML-Dateien zu verweisen und wird vom W3C
gefördert und weiterentwickelt (XSL/XSLT-Seite
des W3C). Eine typische Anwendung
verwendet XSTL-Stylesheets, in denen mit XPath-Ausdrücken
auf bestimmte Teile einer XML-DAtei verwiesen wird, um diese in
XSL-FO konforme Asudrücke zu übersetzen.
XSLT
– Extensible Stylesheet Transformation
Language. XSLT ist eine Ableitung von XSL
und ermöglicht die Konvertierung von XML
Daten in andere Textformate. Dabei definiert XSLT, wie die Konvertierung
ablaufen soll. XSLT und wird vom W3C gefördert
und weiterentwickelt (XSL/XSLT-Seite
des W3C)
XSL-FO
– Extensible Stylesheet Language
Formatting Objects. XSL-FO ist von XSLT
abgeleitet, kombiniert CSS und DSSSL
und ermöglicht eine stabile Formatierung von XML-Dokumenten
für die Printausgabe, z.B. als PDF. XSLT
und wird vom W3C gefördert und weiterentwickelt
(XSL/XSLT-Seite
des W3C)
[top]
- Y -
[top]
- Z -
[top] |