ZeplProjekteProjektentwickungenreportsStatutImpressumLinksGlossarLogo
 

Glossar (im Entstehen)

Häufige Begriffe aus dem Bereich "Elektronisches Publizieren".

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z

- A -

Archivformat – Im Gegensatz zur Archivierung von Schriftstücken gibt es für die Archivierung (v.a. Langzeitarchivierung) von digitalen Dokumenten noch keinen großen Erfahrungsschatz. Doch auch, wenn es noch keinen gemeinsamen und getesteten Standard gibt, werden die folgenden Aspekte inzwischen allgemein für relevant erachtet: Es soll ein archvierbares Format entstehen, das von einem unabhängigen, internationalen Gremium normiert wird und das möglichst unabhängig von einem bestimmten Betriebssystem ist. In das Format sollen andere Datentypen (wie z.B. Bilder, Videos, Töne) integrierbar sein. Es soll eine inhaltlich gebundene Recherche im Volltext und in den Metadaten möglich sein und eine Konvertierbarkeit in andere Formate (und damit eine möglichst freie Wahl der Präsentationsform, die dem gegebenen Inhalt entspricht) muss ohne Datenverluste ermöglicht werden. (s. in diesem Zusammenhang: OAI, DOI, Metadaten, XML)

[top]

- B -

[top]

- C -

CGI Common Gateway Interface. CGI ist eine Server-Schnittstelle, die die Ausführung von Programmen/Scripts ermöglicht. Die häufigste Scriptsprache für diese Schnittstelle ist Perl.

Compiler – Ein Compiler ist eine Software, die Programmcode (s.Quellcode) in Maschinensprache übersetzt und das Ergebnis in Programmdateien abspeichert. Der Quellcode ist damit nicht mehr zugänglich und muss – im Falle eines Open-Source Projektes – separat bereitgestellt werden (zu beachten ist der Unterschied zum Interpreter).

Content-Management-System – (s. Redaktionssystem)

CSSCascading Style-Sheets. Das speziell für HTML entwickelte Stylesheet-Format ist eine Ergänzungssprache, die ein beliebiges Formatieren einzelner HTML-Elemente ermöglicht. Dies vereinfacht z.B. in umfangreichen Web-Projekten eine einheitliche Formatierung oder ist bei der Bereitstellung eines HTML-Dokumentes für verschiedene Ausgabeformate (Bildschirm, Drucker, etc.) behilflich. CSS ist eine normierte Sprache und wird vom W3C gepflegt und weiterentwickelt (CSS-Seite des W3C).

CVS (-Server)Concurrent Versions System. CVS ist ein Versionskontrollsystem. Durch die Verwendung können die Änderungen bzw. die Historie einer Quelldatei aufgezeichnet werden. Dabei wird nicht für jede Version eine eigene Datei angelegt, sondern CVS speichert die Veränderungen immer in einer Datei. Ein CVS-Server ermöglicht das gleichzeitige Arbeiten mehrerer Programmierer an einer Quelldatei. Im "open-source"-Umfeld ist CVS inzwischen Standard.

[top]

- D -

Datenbank – In einer Datenbank werden Informationen (z.B. Adressen) in der Form von Datensätzen – meist in Tabellen – gespeichert. Einen Datensatz kann man sich als eine Zeile in der Tabelle vorstellen. Die Tabellenspalten stellen Sortierkriterien dar (Eine Adresse [also eine Zeile] besteht aus [den Spalten] Name, Vorname, Strasse, Wohnort und kann entsprechend z.B. nach Wohnort [alle Adressen in München] sortiert bzw. gefiltert werden). Besondere Bedeutung haben die sogenannten "relationalen Datenbanken". Eine relationale Datenbank speichert Daten in separaten Tabellen und nicht in einem großen Speicherraum. Die Tabellen werden durch definierte Beziehungen verbunden (Relationen). Dies ermöglicht, Daten aus verschiedenen Tabellen auf Nachfrage zu kombinieren. Beispiele für realtionale Datenbanken sind Microsoft Access und MySQL.

DocBook – DocBook ist eine Document Type Definition. Ursprünglich wurde sie für Dokumente mit technischem Inhalt erstellt. Inzwischen fand sie jedoch - v.a. wegen ihrer Flexibilität - auch Einzug in andere Bereiche, wie z.B. literaturwissenschaftliche Rezensionen, o.ä.

DOI Digital Object Identifier. Ein DOI ist eine Zeichenkette, die ein Objekt eindeutig identifiziert. Sie wird elektronischen Publikationen zugeordnet und identifiziert diese eindeutig (vergleichbar mit der ISBN für Bücher). DOI befindet sich derzeit in der zweiten Prototyp-Phase (Stand 02/2003) und soll zukünftig ein Standard im elektronischen Publikationswesen werden. In Deutschland ist die ISBN-Agentur für die Bundesrepublik Deutschland zuständig. Mehr Details...

DTDDocument Type Definition. Die DTD ist eine normative Definition z.B. von HTML in SGML bzw. von XHTML in XML. Grundsätzlich beinhaltet eine DTD die Informationen, die regeln welche Tags und Textelemente es gibt, wann sie vorkommen dürfen (Kontextabhängigkeit), welche Attribute erlaubt sind und in wie weit Tags und Daten innerhalb eines Tags erlaubt sind. Auch andere auf SGML/XML basierende Dokumententypen können durch eine DTD definiert werden. Das W3C bestimmt mit Hilfe von DTDs die jeweiligen Versionen von HTML, XML, etc. In den ersten Zeilen einer HTML-Datei findet sich oft ein Verweis auf eine DTD (z.B. am Anfang dieses Dokumentes: <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">).

DSSSLDocument Style Semantics and Specification Language (gesprochen "Dissel"). Genau genommen ist DSSSL mehr als nur die Definition einer layoutbeschreibenden Sprache. Es ermöglicht komplexe Transformationsprozesse von SGML-Daten. Zum einfacheren Verständnis genügt es jedoch, sich DSSSL als Stylesheet-Format von SGML vorzustellen. DSSSL ist der Vorläufer von XSL.

Dublin Core – Dublin Core ist ein Metadatenformat . In internationaler Zusammenarbeit ist ein Kernsatz von 15 Elementen (Titel, Autor, Schlagwort, verwendete Dateiformate, etc...) entstanden, die der Autor einer Publikation selbst vergibt. Damit sollen elektronische Textobjekte im WWW schneller und leichter identifizierbar sein. Mehr Details...

Dynamischer Inhalt – Im Unterschied zum statischen Inhalt einer "normalen" HTML-Seite werden die gewünschten Informationen auf einer Web-Seite erst im Moment der Anfrage zusammengestellt. Meist arbeitet im Hintergrund eine Datenbank, aus der die Informationen ausgelesen werden (z.B. werden bei einem Online-Telefonbuch die gesuchten Nummern entsprechend der vorherigen Suchanfrage zusammengestellt).

[top]

- E -

Elektronisches Publizieren – Unter elektronischen Publikationen versteht man Veröffentlichungen, die zur Darstellung elektronische Medien verwenden. Zu unterscheiden sind On- und Offline-Publikationen, also solche, die das Internet nutzen (online) und solche, die auf lokalen Datenträgern (CD-ROM, DVD, Diskette) veröffentlicht werden.

E-JournalElectronic Journal. Ein E-Journal ist eine elektronische Zeitschrift.

[top]

- F -

Framework – Ein Framework ist ein Umfeld von Anwendungen (Programmen), das auf bestimmte Bedürfnisse zugeschnitten werden kann.

FOPFormatting Object Processor. FOP ist ein Teil des Apache XML Projektes und ermöglicht die Konvertierung von XML-Dokumenten in PDF. (s.auch XSL-FO)

[top]

- G -

GNU – (ausgesprochen wird es "Ge-NJUH") GNU ist eine rekursive Abkürzung für GNU's Not Unix. Dabei geht es um die Entwicklung eines unabhängigen, Unix-ähnlichen Betriebssystems. Es gilt auch wegen seiner Rechtsform (open source) als vorbildhaft.Mehr Details...

GNU Eprints – GNU Eprints ist ein Programm zur Erstellung von Online-Archiven. Es soll vor allem im wissenschaftlichen Umfeld das schnellere Auffinden von Publikationen ermöglichen. Mehr Details...

[top]

- H -

HarvesterErntemaschine (s.Suchmaschine)

HTMLHyperText Markup Language. Eine mittels SGML definierte Auszeichnungssprache, die die logischen Bestandteile eines Dokumentes beschreibt. Entsprechend werden typische Elemente eines Dokumentes (Überschriften, Listen, Tabellen, etc.) markiert. HTML ist eine normierte Sprache und wird vom W3C gepflegt und weiterentwickelt (HTML-Seite des W3C). Zur einheitlichen Formatierung eines HTML-Dokumentes werden häufig Stylesheets im CSS-Format verwendet.

[top]

- I -

InterpreterEine Interpreter übersetzt Programmcode (s. Quellcode) im Moment der Ausführung in Maschinensprache. So werden z.B. Java Scripts im Moment der Ausführung von einem Interpreter im Browser übersetzt (zu beachten ist der Unterschied zum Compiler).

[top]

- J -

[top]

- K -

[top]

- L -

[top]

- M -

Metadaten – Metadaten sind strukturierte Daten, mit deren Hilfe eine Informationsressource beschrieben und dadurch besser auffindbar gemacht wird. Geliefert werden Grundinformationen über ein Dokument (z.B. Autor, Titel, Ort/Datum der Veröffentlichung s. DublinCore). Die Nähe zur bekannten Erschließungsarbeit in Bibliotheken erklärt die besonderen Bemühungen der Bibliotheken, einen Standard für Metadaten auch für elektronische Publikationen zu schaffen. Mehr Informationen bieten die SUB-Göttingen und Die Deutsche Bibliothek.

MySQL – Wird "Mai Ess Ku Ell" ausgesprochen. Die populäre Open-Source-Datenbank MySQL (hier zur offiziellen Website) basiert auf SQL, der "Structured Query Language" (strukturierte Abfragesprache), der verbreitetsten standardisierten Sprache für Datenbankzugriffe. Eine SQL-Datenbank hält in der Regel auf einem Server Informationen bereit, die bei Bedarf abgefragt werden können und die meist in HTML-Seiten eingebunden werden (man spricht auch von "dynamischen Inhalten"). Häufig wird in Verbindung mit MySQL PHP verwendet.

[top]

- N -

[top]

- O -

OAIOpen Archives Initiative. Auf der Basis des "Open Archive Initiative Protocol for Metadata Harvesting" können lokale Dokumenten- und Multimedia-Serversysteme mit einer quasi normierten Schnittstelle zum Austauch von Metadaten versehen werden. Es soll ermöglicht werden, anhand von Metadaten in den Datenbeständen renommierter wissenschaftlicher Dokumentenarchive zu recherchieren.

Online-Archiv – Ein Online-Archiv liegt meist in Form einer Datenbank vor, die bei entsprechender Suchanfrage archivierte Informationen meist in Form von dynamischen HTML-Seiten ausgibt. Wichtig in diesem Zusammenhang sind Metadaten, OAI, DOI. (Mehr Aspekte bei Netzspannung.org).

Open Source – Der Quellcode einer Open-Source-Software ist frei zugänglich (meist im Internet auf den Entwicklerseiten verfügbar, oder auf dem Installationsmedium vorhanden). Dieses – meist nicht-kommerzielle – Verfahren ermöglicht es einer großen Software-Entwicklergemeinde die Software entsprechend der jeweiligen Interessen zu verändern, bzw. grundsätzlich zu verbessern. Weitere typische Merkmale sind: eine kooperative Entwicklergemeinde und die kostenlose Programmverwendung. Wichtige Veränderungen/Verbesserungen werden in den allgemeinzugänglichen Quellcode übernommen und die Software erhält in der Regel eine höhere Versionsnummer. Zur Versionskontrolle hat sich das CVS-Server-System etabliert. Bekanntestes Beispiel einer Open-Source-Software dürfte das Betriebssystem Linux sein.

[top]

- P -

Parser – Ein Parser ist eine Software, die den (Quell-)Code auf korrekte Syntax hin überprüft. Z.B. können HTML-Dokumente beim W3C mittels eines SGML-Parsers auf ihre Syntax hin überprüft werden (zum MarkUp Validation Service).

PDFPortable Document Format. Das von der Firma Adobe ins Leben gerufene Dateiformat PDF dient der Darstellung von Texten, deren Formatierung durch den Leser nicht veränderbar ist. Das macht PDF nicht nur für kommerzielle Publikationen (Handbücher, Formulare, etc), sondern auch für wissenschaftliche Publikationen – vor allem hinsichtlich des "Zitierproblems" in elektronischen Dokumenten – interessant (feste Seitenumbrüche, Grafik immer an gleicher Stelle, etc.). Es gibt zahlreiche, auch kommerzielle Werkzeuge zur Erzeugung von PDF-Dateien. Der Standard
ist ausführlich und offen dokumentiert und es wird daran gearbeitet, z.B. Konvertierungen aus XML zu ermöglichen (s.FOP). Als problematisch gilt der Verlust von Strukturinformationen im PDF, weshalb eine Weiterverarbeitung eines PDFs nicht möglich ist.

Perl Practical Extraction and Report Language. Genaugenommen handelt es sich bei Perl um eine Scriptsprache, die häufig auf Servern verwendet wird. Man kann sie jedoch auch auf dem PC verwenden, besonders für die Manipulation von Texten. Perl wird ähnlich wie PHP oft in Verbindung mit einem Datenbanksystem (z.B. Oracle) oder mit CGI verwendet. Mehr Details...

PHPPHP: Hypertext Preprocessor. Es handelt sich um eine serverseitige Open Source Scriptsprache, die besonders für die Webprogrammierung geeignet ist. PHP kann in HTML eingebettet werden (im Unterschied zu Perl). Trotz eines enormen Funktionsumfangs ist PHP vergleichsweise einfach zu erlernen. Es findet häufig in Verbindung mit MySQL Anwendung. Mehr Details...

[top]

- Q -

Quellcode – Der Quellcode ist der aus Befehlen, Abfragen und Ähnlichem aufgebaute Programmcode einer Software. Von Quellcode spricht man sowohl bei Auszeichnungssprachen (z.B. HTML), als auch bei Scriptsprachen (z.B. PHP) und höheren Programmiersprachen (z.B. C++). Der Quellcode bedarf immer einer Übersetzung in Maschinensprache. Dies wird entweder durch einen Compiler oder Interpreter erledigt .

[top]

- R -

RDF – Resource Description Framework. RDF ist ein flexibles System (beruhend auf der Syntax von XML) für die Codierung, den Austausch und die Wiederverwendung von Metadaten. Es wird vom W3C entwickelt und gepflegt und beinhaltet Entwicklungen wie z.B. Dublin Core u.a. (zur RDF-Seite des W3C).

Redaktionssystem

Relationale Datenbank – (s.Datenbank)

Rendering – "Übersetzung" oder "Übertragung"

RTF – Rich Text Format. Ein von Microsoft entwickeltes Dateiformat, das speziell für den Austausch formatierter Texte zwischen verschiedenen Textverarbeitungsprogrammen verwendet wird. Die Formatierungen bleiben dabei erhalten.

[top]

- S -

Semantic Web – Das Semantic Web ist eine Vision von der Erweiterung des Internets, um die im WWW verfügbaren Informationen mit für Maschinen verarbeitbarer Semantik zu erweitern. Es handelt sich dabei um eine offene, aktive und v.a. vom W3C vorangetriebene Forschungsunternehmung, die im Zusammenhang mit der Diskussion um Metadaten oder Schlagworte, wie. z.B. RDF, XML, etc. gesehen werden muß. (zur Semantic-Web-Seite des W3C)

Server – Ein Server ist ein spezieller Computer in einem Computernetzwerk. Er zeichnet sich dadurch aus, dass er anderen Computern bestimmte Leistungen zur Verfügung stellt. Beispielsweise gibt es Fileserver (FTP), Mailserver, CVS-Server.

SGMLStandard Generalized Markup Language. SGML wurde bereits 1986 als ISO-Standard (ISO 8879) festgeschrieben und ist gewissermaßen die "Urmutter" aller Auszeichnungssprachen (wie z.B. HTML). Wegen seiner Komplexität ist SGML als "Alltagssprache" eher nicht geeignet. In engem Zusammenhang mit SGML steht das Format DSSSL.

Scriptsprache – Ein Script besteht aus einer Liste von Befehlen, die ohne Eingreifen eines Benutzers vom Computer abgearbeitet werden können. Der Quellcode eines Scripts wird erst unmittelbar bei dessen Verwendung interpretiert. Bekannte Scriptsprachen sind: JavaScript, Perl oder PHP.

SQLStructured Query Language. (s. MySQL)

Stylesheet – Ein Stylesheet ist am ehesten mit einer Formatvorlage zu vergleichen. Es interpretiert die zugewiesenen Daten (HTML,XML, etc.) und formatiert sie (z.B. für die Bildschirmausgabe) entsprechend der im Stylesheet vorgegebenen Regeln. Bekannte Stylesheetformate sind CSS und XSL.

Suchmaschine – Grundsätzlich sind Suchmaschinen Suchhilfen, die einen oder mehrere Server nach bestimmten Kriterien durchsuchen. Meist wird mit Hilfe von Datenbanken eine Stichwort- oder Volltextsuche ermöglicht. Suchmaschinen werden gelegentlich als "Spinnen im weltweiten Spinnennetz" oder Erntemaschinen ("Harvester") bezeichnet.

[top]

- T -

Tag

TEI

[top]

- U -

Unix – die rekursive Abkürzung:"UNIX is Not multICS" (MULTICS ist ein obsoletes Betriebssystem des MIT) steht für ein Multitask- und Multiuser-Betriebssystem, das Ende der 60er Jahre von den Bell Laboratories entwickelt wurde und bis heute in verschiedenen Formen für leistungsstarke Server-Rechner in einer Netzwerkumgebung eingesetzt wird.

[top]

- V -

[top]

- W -

W3C World Wide Web Consortium. Das W3C wurde im Oktober 1994 gegründet. Es entwickelt einheitliche Technologien (Spezifikationen, Richtlinien, Software und Tools), die den Fortschritt des Webs fördern und Interoperabilität sicherstellen sollen.

[top]

- X -

XHTMLExtensible Hypertext Markup Language. XHTML ist eine Auszeichnungssprache für Web-Seiten, die vom W3C gefördert und gepflegt wird. Sie entstand durch eine Neuformulierung von HTML auf der Basis von XML. Ziel dieser Entwicklung ist es, Inhalt, Struktur und Formatierung eines Dokuments voneinander zu trennen (XHTML-Seite des W3C).

XMLExtensible Markup Language. XML ist eine Metaauszeichnungssprache bzw. eine Regelsystem, um Auszeichnungssprachen zu definieren. Es ist eine Teilmenge von SGML, die so konzipiert ist, dass die damit erstellten Regeln entweder explizit in einer DTD formuliert werden (Alle Texte, die den Regeln ihrer DTD folgen sind "valid", also gültig). Eine solche Überprüfung geschieht mit einem Parser, oder die Texte gehorchen lediglich den allgemeinen Bauregeln von XML-Dateien (und gelten dann als "well-formed", "also wohlgeformt"). Inzwischen gibt es zahlreiche Auszeichnungssysteme für spezifische Anwendungsgebiete, z.B. für das technische Publizieren DocBook, oder für philologische Texte TEI. Die Mächtigkeit (und das Problem) von XML liegt auch in den zahlreichen Kostandards wie z.B. XSL, XML Query, XML Schema usw.

XPath

XSLExtensible Stylsheet Language. XSL (eine Ergänzungssprache zu XML) besteht aus drei Sub-Standards: XSLT (Transformationssprache), XSL-FO (Rendering von XML-Dateien), XPath (Sprache, um auf Teile von XML-Dateien zu verweisen und wird vom W3C gefördert und weiterentwickelt (XSL/XSLT-Seite des W3C). Eine typische Anwendung verwendet XSTL-Stylesheets, in denen mit XPath-Ausdrücken auf bestimmte Teile einer XML-DAtei verwiesen wird, um diese in XSL-FO konforme Asudrücke zu übersetzen.

XSLTExtensible Stylesheet Transformation Language. XSLT ist eine Ableitung von XSL und ermöglicht die Konvertierung von XML Daten in andere Textformate. Dabei definiert XSLT, wie die Konvertierung ablaufen soll. XSLT und wird vom W3C gefördert und weiterentwickelt (XSL/XSLT-Seite des W3C)

XSL-FOExtensible Stylesheet Language Formatting Objects. XSL-FO ist von XSLT abgeleitet, kombiniert CSS und DSSSL und ermöglicht eine stabile Formatierung von XML-Dokumenten für die Printausgabe, z.B. als PDF. XSLT und wird vom W3C gefördert und weiterentwickelt (XSL/XSLT-Seite des W3C)

[top]

- Y -

[top]

- Z -

[top]

 

Seite wird betreut von: Marcel Schellong. Kritik, Anmerkungen und v.a. Ergänzungen werden gerne entgegengenommen. (Zuletzt verändert 17.April 2003)

 
Trennlinie
Zepl | Projekte | Entwicklungen | Reports | Statut | Impressum | Links | Glossar