World Wide Web
Ten artykuł jest częścią serii World Wide Web Struktura stron WWW (X)HTML, XML, XSL Generowanie dynamicznych stron WWW ASP, ASP.NET, JSP, PHP, Profile MSP Po stronie użytkownika CSS, JavaScript, AJAX, Kolory w Internecie Przesyłanie danych HTTP(S), HTTP referrer, Serwer WWW, VoiceXML, XMLHttpRequest Pojęcia Architektura informacji, Użyteczność (web-usability), Dostępność (WWW)Spis treści
- 1 Historia
- 2 Funkcja
- 2.1 Co oznacza określenie WWW
- 3 Linki zewnętrzne
- 4 Dynamiczne Aktualizacje stron WWW
- 5 Prefiks WWW
- 6 Prywatność
- 7 Bezpieczeństwo
- 8 Standardy
- 9 Dostępność
- 10 Międzynarodowość
- 11 Statystyki
- 12 Kwestie prędkości
- 13 Buforowanie
- 14 Zobacz też
- 15 Przypisy
- 16 Linki zewnętrzne
Historia
Brytyjski inżynier i naukowiec sir Tim Berners-Lee, obecnie dyrektor World Wide Web Consortium (W3C), napisał w marcu 1989 projekt oparty na ENQUIRE (aplikacji i bazie danych, którą stworzył na własny użytek w 1980). Przedstawił w nim dużo bardziej rozbudowany system zarządzania informacjami, który stał się zalążkiem obecnej WWW. Po jakimś czasie dołączył do niego belgijski naukowiec Robert Cailliau, z którym Lee współpracował w ośrodku CERN (Genewa w Szwajcarii). 12 listopada 1990 opublikowali oficjalny projekt budowy systemu hipertekstowego zwanego World Wide Web (w skrócie W3), obsługiwanego przy pomocy przeglądarki internetowej, używającego architektury klient-serwer. Użycie hipertekstu umożliwiło dostęp do różnego rodzaju informacji poprzez sieć węzłów. Użytkownik oglądając stronę internetową może podążać za hiperłączami, które przenoszą go do innych stron internetowych w ramach tego samego serwera internetowego lub innych dostępnych w ramach sieci.Funkcja
Terminy internet i World Wide Web są często stosowane zamiennie w codziennym języku. Jednak Internet i World Wide Web nie są jednym i tym samym. Internet to globalny system połączonych ze sobą sieci komputerowych. W przeciwieństwie do sieci Web, która jest jedną z usług działających w internecie. WWW jest to zbiorem powiązanych ze sobą zasobów i dokumentów, połączonych hiperłączami i URL-ami. Krótko mówiąc, sieć Web jest aplikacją działającą w internecie. Przeglądanie stron internetowych w sieci WWW zwykle rozpoczyna albo od wpisania adresu strony w przeglądarce internetowej, albo poprzez podanie linku do tej strony lub linku do konkretnego zasobu. Następnie przeglądarka wysyła do serwera, na którym zlokalizowana jest strona, szereg niewidzialnych dla nas zapytań, aby później pobrać zawartość danej strony i wyświetlić ją na ekranie monitora. Na początku nazwa serwera (część adresu URL) jest dekodowana na adres IP za pomocą globalnej, rozproszonej bazy danych znanej jako Domain Name System (DNS). Adres IP jest niezbędny, aby móc połączyć się z danym serwerem. Przeglądarka następnie wywołuje dany zasób, wysyłając zapytanie do serwera określonego powyższym adresem. W przypadku typowej strony internetowej, przeglądarka najpierw pobiera jej skrypt HTML, analizuje go a następnie wysyła zapytanie o resztę elementów wchodzących w jej skład (zdjęcia, grafika, dźwięki, video, animacje). Statystyki mierzące popularność stron zazwyczaj są oparte o liczbę odwiedzin ale również o liczbę wysłanych na serwer zapytań, które miały miejsce. Podczas pobierania plików z serwera WWW, przeglądarki mogą stopniowo składać stronę na ekranie w sposób określony przez jego kod HTML, CSS lub inne języki skryptowe. Wszelkie zdjęcia i inne zasoby są włączane do strony, którą użytkownik widzi na ekranie. Większość stron internetowych zawiera hiperłącza umożliwiające bezpośrednie przechodzenie do innych stron z nimi powiązanych, gotowych plików, które można pobierać, dokumentów źródłowych, definicji oraz innych zasobów internetowych. Taki zbiór przydatnych materiałów powiązanych ze sobą za pośrednictwem łączy hipertekstowych, nazwano "siecią" informacji. Udostępniając "sieć" w internecie, Tim Berners-Lee nazwał ją w listopadzie 1990 roku World Wide Web (początkowo "CamelCase", jednak nazwa ta została później odrzucona).Co oznacza określenie WWW
W3 (WWW) reprezentuje wiele pojęć:- Idea nieograniczonego świata informacji, połączonego za pomocą łączy hipertekstowych w celu łatwego dostępu;
- Uniform Resource Identifier (URI), koncepcja systemu adresowania wdrożona by umożliwić połączenia sieci, pomimo wielu różnych protokołów;
- Hypertext Transfer Protocol (HTTP), protokół sieciowy używany do przesyłania stron internetowych;
- HyperText Markup Language (HTML), hipertekstowy język znaczników, zrozumiały przez każdą przeglądarkę WWW, służący formatowaniu tekstu, menu oraz pozostałej zawartości strony.
Linki zewnętrzne
Z biegiem czasu wiele zasobów internetowych zanika, zostaje przeniesionych, zaktualizowanych lub całkowicie zmienia się ich zawartość. To sprawia, że hiperłącza stają się przestarzałe. Określa się je wtedy mianem tzw. "martwych linków". Problem ten spowodował, że podjęto wiele wysiłków w kierunku archiwizacji stron internetowych. Internet Archive, działające od 1996 roku, jest najbardziej znaną instytucją zajmującą się archiwizacją zasobów internetu.Dynamiczne Aktualizacje stron WWW
W celu pokonania pewnych ograniczeń w modelowaniu stron, niektóre aplikacje internetowe korzystają z technologii AJAX (Asynchronous JavaScript and XML).JavaScript jest językiem skryptowym, który został pierwotnie opracowany w 1995 roku przez Brendana Eicha, później rozwijanym przez firmę Netscape, do wykorzystania w ramach stron www. Jego pierwowzorem jest ECMAScript. Typowy skrypt jest wysyłany razem z kodem strony i może on wysyłać dodatkowe zapytania do serwera w odpowiedzi na działania użytkownika, takie jak np. kliknięcia myszą lub bazując na ustalonych odstępach czasowych. Odpowiedzi z serwera są wykorzystywane do modyfikacji bieżącej zawartości strony, zamiast tworzyć ją od nowa po każdej odpowiedzi. W ten sposób serwer wykorzystuje pierwotną informację tylko w pewnym ograniczonym stopniu. Zmniejsza to czas wyświetlania strony a także wykorzystanie łącza i obciążenie serwera. Zapytania skryptowe AJAX mogą być wysyłane po kilka na raz, użytkownicy mogą korzystać z zawartości strony również wtedy, gdy dane są w trakcie pobierania. Niektóre aplikacje internetowe potrafią regularnie monitorować serwer na wypadek zmiany zawartości strony.Prefiks WWW
Wiele adresów internetowych zaczyna się od www ze względu na długoletnią praktykę nazywania hostów internetowych (serwerów) zgodnie z usługami, które oferowały. Nazwa hosta dla serwera Web to najczęściej www, tak jak ftp dla serwera FTP czy news lub nntp dla serwerów informacyjnych Usenet. Te nazwy hostów ukazują się, jako subdomeny w Domain Name System (DNS), jak w przykładzie www.example.com. Stosowanie takich subdomen nie jest wymagane. Pierwszy na świecie serwer Web nazywał się nxoc01.cern.ch, a wiele stron internetowych istnieje bez prefiksu WWW, czy innych takich jak "www2" , "secure" itp. Prefiksy subdomen nie mają żadnego praktycznego znaczenia, są to zwykłe nazwy nadane przez administratorów. Wiele serwerów internetowych jest tak skonfigurowanych, aby korzystać z obu wersji adresu, zarówno samej domeny (example.com) jak i z subdomeną (www.example.com). W praktyce kierują one użytkownika dokładnie do tej samej strony. W przypadku wpisania tylko jednego specyficznego słowa w pasku adresu przeglądarki, np.: apple <enter>, openoffice <enter> aplikacja sama spróbuje dodać przedrostek www i końcówkę np.: ".com", ".org" lub ".net" i przekieruje nas np. na stronę "http://www.apple.com/", czy http://www.openoffice.org/. Funkcje te zostały wprowadzone we wczesnych wersjach przeglądarki Mozilla Firefox (znanej pod roboczym tytułem Firebird) na początku 2003. Firma Microsoft otrzymała w 2008r patent w USA na to samo rozwiązanie z tym, że tylko w odniesieniu do urządzeń mobilnych. Przedrostki "http://" i "https://" należy rozróżniać. Hypertext Transfer Protocol (HTTP) i HTTP Secure wyznaczają protokół komunikacyjny, który ma zostać użyty do wysyłania i pobierania zawartości strony. Protokół HTTP jest podstawowym elementem działania struktury www a HTTPS dodaje niezbędną warstwę ochronną w przypadku, gdy poufne informacje, takie jak hasła czy dane bankowe mają być przesyłane w publicznej sieci Internet. Przeglądarki internetowe również automatycznie dopisują ten element (HTTPS), jeśli zostanie on pominięty. Ogólny zarys RFC 2396 określający postać adresów internetowych to: <protokół>://<host><ścieżka>?<zapytanie>#<fragment> , gdzie <host> to np. serwer internetowy (jak www.example.com) a ścieżka identyfikuje konkretna podstronę. Serwer przetwarza <zapytanie> , które może np. za pośrednictwem formularza wysłać dane do zewnętrznej wyszukiwarki, poprzez to zawartość wyświetlanej strony jest zależna od odebranych informacji zwrotnych. <fragment> nie jest wysyłany do serwera. Określa która część strony ma być wyświetlana użytkownikowi domyślnie. W języku angielskim www wymawiane jest przez pojedyncze wypowiedzenie ciągu znaków (double-u double-u double-u). Niektóre kręgi użytkowników wymawiają dub-dub-dub, aczkolwiek ten sposób nie jest jeszcze zbyt powszechny. Angielski pisarz Douglas Adams zażartował kiedyś w "The Independent on Sunday (1999): "World Wide Web jest z tego co wiem jedynym wyrażeniem którego skrócona forma jest trzy razy dłuższa od pełnej". Określenie World Wide Web jest powszechnie tłumaczone na język chiński jako: wan wei wǎng, co dosłownie oznacza "mnóstwo wymiarów sieci". Tłumaczenie to bardzo dobrze odzwierciedla koncepcję projektu i założenia WWW. Tim Berners-Lee zdefiniował, iż wyrażenie Word Wide Web powinno być pisane jako 3 osobne słowa bez żadnych dodatkowych łączników.Prywatność
Użytkownicy komputerów, którzy oszczędzają czas i pieniądze, a także Ci, którzy poszukują wygody i rozrywki, są narażeni na utratę prywatności w sieci. Na całym świecie ponad pół miliarda osób korzysta z serwisów społecznościowych, a młodzież dorastająca w dobie internetu dokonuje kolejnej zmiany pokoleniowej. Z Facebooka początkowo rozpowszechnionego pośród amerykańskich studentów korzysta dziś ponad 70% użytkowników z innych państw niż USA. W 2009r na portalu uruchomiono test nowych narzędzi umożliwiających dostosowanie ochrony prywatności, jednakże tylko 20% użytkowników rozpoczęło korzystanie z nich. Same serwisy wykorzystują część powierzonych im danych użytkowników do celów reklamowych. Osoba korzystająca z internetu ma możliwość usunięcia historii przeglądanych stron, zablokowanie niektórych ciasteczek (cookies) oraz wyskakujących okienek jednakże nie zapewnia to pełnej ochrony prywatności.Bezpieczeństwo
Sieć Web stała się otwartą drogą dla przestępców rozprzestrzeniających złośliwe oprogramowanie. Cyberprzestępczość prowadzona w internecie może składać się z kradzieży tożsamości, oszustw, szpiegostwa i gromadzenia poufnych informacji. Połączenie z internetem przewyższa tradycyjne zagrożenia dla bezpieczeństwa danych przetwarzanych przy pomocy komputera, a jak szacuje Google, około jedna na dziesięć stron internetowych może zawierać złośliwy kod. Większość ataków opartych na sieci Web odbywa się z poziomu legalnych stron internetowych, a najczęściej, jak szacuje firma Sophos, ataki są prowadzone w Stanach Zjednoczonych, Chinach i Rosji. Najpowszechniejszym typem zagrożeń jest SQL injection. Za pomocą języka HTML i URI sieć Web została również narażona na ataki, takie jak cross-site scripting (XSS), które pojawiły się wraz z wprowadzeniem JavaScript, następnie zostały rozszerzone do pewnego stopnia przez Web 2.0 i Ajax, używające dużych ilości skryptów. Dziś szacunkowo 70% wszystkich stron internetowych jest niezabezpieczonych przed atakami XSS.Standardy
Funkcjonowanie sieci World Wide Web w internecie oraz wymiana informacji pomiędzy komputerami opiera się na wielu standardach i specyfikacjach technicznych. Duża część tych dokumentów są to opracowania World Wide Web Consortium (W3C), kierowanego przez Berners'a-Lee, ale niektóre z nich są dziełem Internet Engineering Task Force (IETF) oraz innych organizacji. Gdy wspominamy o standardach internetowych najczęściej mamy do czynienia z następującymi publikacjami:- Zalecenia W3C dla języków znaczników, zwłaszcza HTML i XHTML. Określają one struktury interpretacji dokumentów hipertekstowych.
- Zalecenia W3C dla arkuszy stylów, szczególnie CSS.
- Standardy ECMAScript (zazwyczaj w formie JavaScript), z ECMA International.
- Zalecenia W3C dotyczące modelowania dokumentów obiektowych .
- Uniform Resource Identifier (URI), który jest uniwersalnym systemem odniesień do zasobów w Internecie, takich jak dokumenty hipertekstowe i obrazy. URI, często nazywane URL jest definiowane przez IETF RFC 3986 STD / 66: Uniform Resource Identifier (URI): Generic Syntax.
- Protokół HTTP, a konkretnie RFC 2616: HTTP/1.1 i RFC 2617: Autoryzacja HTTP, które określają, jak przeglądarka i serwer uwierzytelniają siebie nawzajem.
Dostępność
Na dzień dzisiejszy dostęp do sieci jest możliwy dla wszystkich, bez względu na to, czy użytkownik jest osobą w pełni czy niepełnosprawną. Niezależnie od rodzaju niepełnosprawności, sieć Web służy przesyłaniu, jak również pozyskiwaniu informacji oraz interakcji ze społeczeństwem, przez co niezmiernie ważne jest, aby umożliwić dostęp do sieci osobom niepełnosprawnym, często ograniczonym ruchowo. Tim Berners-Lee twierdzi, iż "potęga internetu polega na jego uniwersalności. Dostępność dla wszystkich, bez względu na niepełnosprawność jest jej głównym aspektem." Wiele krajów wymaga od autorów witryn stosowania ułatwień dostępu. Międzynarodowa ustalenia w ramach "Inicjatywy dostępności do sieci" W3 Consortium (Web Accessibility Initiative) doprowadziły do wystosowania pewnych prostych wytycznych, które autorzy treści internetowych, jak również twórcy oprogramowania mogą wykorzystywać, aby umożliwić "surfowanie" po sieci osobom niepełnosprawnym.Międzynarodowość
W3C zapewnia, że sieć Web będzie dostępna dla wszystkich języków, skryptów i kultur. Na początku 2004r Unicode zyskał znaczną popularność i ostatecznie w grudniu 2007r jako najczęściej używany systemów kodowania znaków w sieci Web wyparł zarówno ASCII jak i zestaw znaków dla Europy Zachodniej. Pierwotnie zbiór RFC 3986 zezwalał obiektom sieci na identyfikację tylko poprzez adresy składające się ze znaków z podgrupy US-ASCII. RFC 3987 uznaje rozszerzony zakres znaków i od tej pory zasoby sieci mogą być identyfikowane poprzez adresowanie w każdym z języków.Statystyki
Według badań z 2001 roku, istniało wtedy więcej niż 550 miliardów dokumentów internetowych, najczęściej dostępnych w WWW lub w Deep Web. W 2002r przebadano zawartość 2.024 mln stron WWW, dzięki czemu wiadomo, że zdecydowanie najwięcej zawartości sieci Web była w języku angielskim: 56,4%; następne były strony w języku niemieckim (7,7%), francuskim (5,6%) i Japońskim (4,9%). Najnowsze badania, wykorzystywały do zebrania próbek stron internetowych wyszukiwarki internetowe w 75 różnych językach. Ustalono, że od końca stycznia 2005 było ponad 11,5 miliardów publicznie indeksowanych stron internetowych. W marcu 2009, indeksowanych stron było już co najmniej 25,21 miliardów. 25 lipca 2008r, inżynierowie oprogramowania Google Jesse Alpert i Nissan Hajaj ogłosili iż wyszukiwarka odkryła bilion unikalnych adresów URL. Spośród nich 74% było komercyjnych lub były to strony działające w domenach najwyższego poziomu.Kwestie prędkości
Frustracja przeciążeniem infrastruktury internetu oraz duże opóźnienia które powodowały spowolnienie przeglądania stron doprowadziły do powstania alternatywnej, pejoratywnej nazwy "Word Wide Wait". Przyspieszenie działania sieci jest ciągle otwartym tematem dyskusji i rozważań użytkowników, specjalistów oraz polem działania technologii QoS. Inne rozwiązania mające na celu przyspieszenie internetu można znaleźć na stronie W3C[2]. Standardowe wytyczne dla idealnego czasu odpowiedzi z serwera to: • 0,1 sekundy (jedna dziesiąta sekundy). Idealny czas reakcji. Użytkownik nie odczuwa jakichkolwiek opóźnień. • 1 sekunda. Największy dopuszczalny czas reakcji. Czas odpowiedzi powyżej 1 sekundy zakłóca pracę użytkownika. • 10 sekund. Niedopuszczalny czas reakcji. Przeglądanie zostanie przerwane, a użytkownik prawdopodobnie ujrzy komunikat błędu.Buforowanie
Jeśli użytkownik często odwiedza daną stronę, jej zawartość nie musi być każdorazowo ściągana z serwera. Praktycznie wszystkie przeglądarki internetowe buforują zawartość stron regularnie odwiedzanych w niedużych odstępach czasu. Zawartość zazwyczaj jest zapisywana na dysku twardym lub w pamięci urządzenia a wysyłane zapytanie zwraca tylko dane, które uległy zmianie od ostatnich odwiedzin. Jeśli zbuforowane dane są nadal aktualne zostaną użyte powtórnie. Buforowanie pomaga zredukować ruch sieciowy w internecie. Decyzja o wygaśnięciu aktualności jest podejmowana niezależnie dla każdego pliku, nieważne czy jest to obraz, szablon stylu, skrypt Java, HTML lub każda inna zawartość strony www. Stąd nawet strony o bardzo dynamicznej zawartości mogą być jedynie częściowo pobierane. Projektanci stron WWW znaleźli korzystne rozwiązania takie jak CCS Data i JavaScript scalające zawartość w kilka obszerniejszych plików co ułatwia ich buforowanie. Umożliwia to zredukowanie ilości pobieranych danych i zmniejszenie obciążenia serwerów. Są też inne elementy struktury internetu, które mogą buforować zawartość. Firmowe i akademickie firewalle często buforują zawartość stron www przeglądanych przez jakiegoś użytkownika z korzyścią dla pozostałych komputerów sieci lokalnej (zobacz buforowanie serwera Proxy). Niektóre wyszukiwarki jak Google i Yahoo! również buforują zawartość stron www. Inaczej niż magazyny wbudowane w serwery Web te potrafią decydować czy pliki zostały zaktualizowane i czy potrzeba je ponownie rozesłać. Projektanci dynamicznie generowanych stron potrafią kontrolować nagłówki HTTP odesłane do przeglądających je użytkowników, więc strony przejściowe lub te zawierające chronione dane nie są buforowane. Banki internetowe i portale wiadomości regularnie wykorzystują tę właściwość. Dane pozyskiwane metoda " GET mogą być buforowane tylko w przypadku, gdy pewne specjalne warunki zostają spełnione, dane uzyskiwane w odpowiedzi poprzez metodę " POST z reguły nie są buforowane.Zobacz też
- HTTP
- URL
- XHTML
- HTML
- World Wide Web Consortium
- historia Internetu
- blog
- webmaster
- Użyteczność (informatyka)
- Dostępność (WWW)
- Web 2.0
- FTP
- Gopher
Przypisy
- ↑ http://www.nic.funet.fi/pub/vms/networking/gopher/gopher-software-licensing-policy.ancient
- ↑ World Wide Web Consortium (W3C)
Linki zewnętrzne
- World Wide Web Consortium (W3C) (ang.)
- Największe na świecie archiwum stron WWW (ang.)
Newsy za zakresu World Wide Web
Singiel "Only Girl (In The World)" jest zwiastunem nowej płyty.
Galeria : 10 najlepszych telewizorówPlazma czy LCD? 50,100 a może 200 Hz? Kupując nasz wymarzony telewizor stajemy przed wieloma trudnymi wyborami. Aby ułatwić to zadanie, eksperci magazynu PC World przygotowali specjalny ranking nowoczesnych telewizorów. Prezentujemy galerię 10 najlepszych telewizorów według oceny redakcji.
Kalibracja telewizora dla każdego - tylko w PC World Extra HDTV!PC World Extra HDTV w sprzedaży! Na płycie: Kalibrator Płaskich Telewizorów do łatwego ustawienia idealnego obrazu i wielokanałowego dźwięku w TV LCD i plazmowych, projektorach oraz kinie domowym. W magazynie m.in.: poradnik zakupowy TV, porady i testy odtwarzaczy Blu-ray, analiza pełnej oferty HDTV z satelity oraz kablówki, a także kompletny test telewizorów, odtwarzaczy Blu-ray i laptopów 3D.
Wirtualne desktopy w laboratorium testowymPonieważ technologia VDI jest stosunkowo nowa, jej znajomość wśród użytkowników względnie słaba, a praktyczne doświadczenia niezbyt liczne, postanowiliśmy przybliżyć przebieg i wyniki testu niektórych dostępnych już na rynku rozwiązań do wirtualizacji komputerów PC, przeprowadzonego przez amerykański tygodnik "Network World". Testowane były zarówno rozwiązania programowe, jak i systemy sprzętowe oferowane przez dużych, znanych producentów, ale też mniejsze firmy specjalizujące się w rozwijaniu technologii VDI.
Agata Szewioła Miss Polski 2010 w obiektywieAgata Szewioła z Żar w woj. lubuskim została Miss Polski 2010 i będzie reprezentować nasz kraj w konkursie Miss World w Chinach. Lubuszanka ma 21 lat, jest studentką Wyższej Szkoły Bankowości we Wrocławiu. Zobacz najpiękniejszą Polkę okiem fotoreporterów Gazety
Nowe Ubuntu już jest! Wersja 10.04 systemu do pobraniaUkazała się nowa wersja jednej z najpopularniejszych dystrybucji Linuksa - Ubuntu. Wydanie oznaczone numerem 10.04 i nazwą kodową Lucid Lynx ("świetlisty ryś") można już pobierać z sekcji Programy PC World.
PC World Testy - Twój pomocnik w zakupachWystartowała nowa wersja serwisu produktowego PC World Testy. Odświeżona szata graficzna i nowe funkcje sprawiają, że przeglądanie setek produktów jest proste i przyjemne. W zestawieniu znajduje się ponad 1600 urządzeń i programów, które pogrupowane są w 21 kategorii głównych. Nasi eksperci dołożyli wszelkich starań aby były rzetelnie opisane i ocenione. Nasz ranking z pewnością pomoże wszystkim w dokonaniu trafnego wyboru i utwierdzeniu się w swojej decyzji przed zakupem sprzętu lub oprogramowania.
Wirtualne desktopy w laboratorium testowymPonieważ technologia VDI jest stosunkowo nowa, jej znajomość wśród użytkowników względnie słaba, a praktyczne doświadczenia niezbyt liczne, postanowiliśmy przybliżyć przebieg i wyniki testu niektórych dostępnych już na rynku rozwiązań do wirtualizacji komputerów PC, przeprowadzonego przez amerykański tygodnik "Network World". Testowane były zarówno rozwiązania programowe, jak i systemy sprzętowe oferowane przez dużych, znanych producentów, ale też mniejsze firmy specjalizujące się w rozwijaniu technologii VDI.