Wat is een URL (Uniform Resource Locator)?
Wanneer u een adres in uw webbrowser typt, gebeuren er veel dingen achter de schermen. En het meeste wordt bepaald door de verschillende delen van de URL die je hebt getypt. Laten we dat van dichterbij bekijken.
Een URL kan uit een aantal verschillende delen bestaan. Er is een hostnaam die verwijst naar een IP-adres van een specifieke bron op internet en een hoop aanvullende informatie die uw browser en de server vertelt hoe u met dingen moet omgaan. U kunt een IP-adres zien als iets als een telefoonnummer. Een hostnaam is net als de naam van een persoon wiens telefoonnummer u wilt opzoeken. En een standaard genaamd het Domain Name System (DNS) werkt op de achtergrond als een telefoonboek en vertaalt de mensvriendelijkere hostnamen naar de IP-adressen die netwerken gebruiken om verkeer te routeren.
Als we die analogie in het achterhoofd houden, laten we eens kijken naar de structuur van een URL en hoe het werkt om u te helpen waar u naartoe wilt.
Hoe een URL wordt gestructureerd
De structuur van een URL werd voor het eerst gedefinieerd door Sir Tim Berners-Lee - de man die het web en de eerste webbrowser had gemaakt - in 1994. URL's combineren in wezen het idee van domeinnamen met het idee om een bestandspad te gebruiken om een specifiek map en bestandsstructuur. Dus, het is vergelijkbaar met het gebruik van een pad zoals C: \ Documents \ Personal \ myfile.txt in Windows, maar met wat extra dingen aan het begin om de juiste server op het internet te vinden waar dat pad bestaat en het protocol dat gebruikt wordt om toegang te krijgen tot de informatie.
Een URL bestaat uit verschillende delen. Neem bijvoorbeeld een basis-URL zoals die in de onderstaande afbeelding wordt weergegeven.
Die eenvoudige URL is onderverdeeld in twee hoofdcomponenten: het schema en de autoriteit.
schema
Veel mensen beschouwen een URL als slechts een webadres, maar zo eenvoudig is het niet. Een webadres is een URL, maar alle URL's zijn geen webadressen. Andere services die u op internet kunt openen, zoals FTP, of zelfs lokaal, zoals MAILTO, zijn ook URL's. Het schemagedeelte van een URL (die letters gevolgd door een dubbele punt) geeft het protocol aan waarmee een app (zoals uw webbrowser) en de server moeten communiceren.
Webadressen zijn de meest voorkomende URL, maar er zijn ook andere. Je ziet dus schema's als:
- HyperText Transfer Protocol (HTTP): dit is het onderliggende protocol van het web en bepaalt welke acties webservers en browsers moeten nemen als reactie op bepaalde opdrachten.
- HTTP Secure (HTTPS): dit is een vorm van HTTP die werkt via een veilige, gecodeerde laag voor veiliger transport van informatie.
- File Transfer Protocol (FTP): dit protocol wordt vaak nog steeds gebruikt voor het overbrengen van bestanden via internet.
In moderne browsers is het schema technisch niet vereist als onderdeel van de URL. Als u een website zoals "www.howtogeek.com" bezoekt, bepaalt uw browser automatisch welk protocol moet worden gebruikt. Toch vereisen sommige andere apps (en protocollen) het gebruik van een schema.
Autoriteit
Het autorisatiegedeelte van een URL (voorafgegaan door twee schuine strepen) wordt opgedeeld in een aantal delen. Laten we beginnen met een heel eenvoudige URL - het soort dat u naar de startpagina van een website zou brengen.
In dit eenvoudige voorbeeld wordt het hele gedeelte "www.example.com" een hostnaam genoemd en wordt het omgezet naar een IP-adres. U kunt ook een IP-adres typen in de adresbalk van uw browser in plaats van de hostnaam als u het toevallig weet.
Maar bij het parseren van de hostnaam helpt het om het achteraf te lezen om te begrijpen wat er aan de hand is, dus hier zijn die componenten:
- Top-level domein: In het voorbeeld hier is "com" het hoofddomein. Dit zijn het hoogste niveau in de hiërarchie van het Domain Name System (DNS) die wordt gebruikt om IP-adressen te vertalen naar eenvoudige taaladressen die wij mensen gemakkelijker kunnen onthouden. Deze topleveldomeinen worden gemaakt en beheerd door de Internet Corporation for Assigned Names and Numbers (ICANN). De drie meest voorkomende hoofddomeinen zijn .com, .net en .gov. De meeste landen hebben ook hun eigen tweeletter-domein op het hoogste niveau, dus u ziet domeinen zoals .us (Verenigde Staten), .uk (Verenigd Koninkrijk), .ca (Canada) en vele anderen. Er zijn ook enkele extra topleveldomeinen (zoals .museum) die worden gesponsord en beheerd door particuliere organisaties. Naast deze zijn er ook enkele generieke topleveldomeinen (zoals .club, .life en .news).
- subdomein: Aangezien DNS een hiërarchisch systeem is, worden zowel de "www" - als de "voorbeeld" -onderdelen van onze voorbeeld-URL beschouwd als subdomeinen. Het "www" -gedeelte is een subdomein van het "com" -domein op het hoogste niveau, en het "www" -gedeelte is een subdomein van het "voorbeeld" -domein. Daarom wordt vaak een bedrijf met een geregistreerde naam zoals 'google.com' weergegeven in afzonderlijke subdomeinen zoals 'www.google.com', 'news.google.com', 'mail.google.com' en spoedig.
Dat is het eenvoudigste voorbeeld van de authority-sectie van een URL, maar dingen kunnen ingewikkelder worden. Er zijn twee andere componenten die de authority-sectie kan bevatten:
- Gebruikers informatie: De machtigingssectie kan ook een gebruikersnaam en wachtwoord bevatten voor de site die u bezoekt. Het is ongebruikelijk om deze structuur vandaag in URL's te zien, maar het kan gebeuren. Indien aanwezig, komt het gebruikersinformatiegedeelte voor de hostnaam en wordt gevolgd door een @ -teken. Mogelijk ziet u zoiets als '//username:[email protected]' als dit de gebruikersinformatie bevat.
- Poortnummer: Netwerkapparaten gebruiken IP-adressen om informatie op de juiste computer in een netwerk te krijgen. Wanneer dat verkeer aankomt, vertelt een poortnummer aan de computer de toepassing waarvoor dat verkeer is bedoeld. Het poortnummer is een ander element dat u niet vaak zult zien tijdens het surfen op internet, maar mogelijk ziet u dit in netwerk-apps (zoals games) waarvoor u een URL moet invoeren. Als de URL een poortnummer bevat, komt deze achter de hostnaam en wordt deze voorafgegaan door een dubbele punt. Het ziet er ongeveer zo uit: "//www.example.com:8080."
Dit zijn dus de schema- en autorisatiegedeelten van een URL, maar zoals je misschien al geraden had na het bekijken van veel URL's tijdens het surfen op internet, kunnen ze zelfs nog meer spullen bevatten.
Paden, query's en fragmenten
Er zijn drie extra delen van een URL die u mogelijk ziet na het autorisatiegedeelte: paden, query's en fragmenten. Dit is hoe ze werken.
Pad
Het authority-gedeelte van een URL brengt uw browser (of een andere app) naar de juiste server in een netwerk. Het volgende pad - dat werkt als een pad in Windows, macOS of Linux - brengt u naar de juiste map of het juiste bestand op die server. Het pad wordt voorafgegaan door een schuine streep en er is een schuine streep tussen elke map en submap, zoals deze:
www.example.com/folder/subfolder/filename.html
Het laatste stuk is de naam van het bestand dat wordt geopend wanneer u de website bezoekt. Hoewel je het misschien niet in de adresbalk ziet, wil dat nog niet zeggen dat het er niet is. Sommige talen die worden gebruikt om webpagina's te maken, verbergen de bestandsnaam en de extensie die u bekijkt. Hierdoor is de URL gemakkelijker te onthouden en te typen en krijgt deze een schoner uiterlijk.
vraag
Het querygedeelte van een URL wordt gebruikt om zaken te identificeren die geen deel uitmaken van een strikte padstructuur. Meestal ziet u ze gebruikt wanneer u een zoekopdracht uitvoert of wanneer een webpagina gegevens levert via een formulier. Het querygedeelte wordt voorafgegaan door een vraagteken en komt achter het pad (of na de hostnaam als een pad niet is inbegrepen).
Neem als voorbeeld deze URL die werd gepresenteerd toen we in Amazon naar de trefwoorden "wi-fi extender" zochten:
https://www.amazon.com/s/ref=nb_sb_noss_2?url=search-alias%3Daps&field-keywords=wi-fi+extender
Het zoekformulier gaf informatie door aan de zoekmachine van Amazon. Na het vraagteken kun je zien dat de query uit twee delen bestaat: een URL voor de zoekopdracht (dat is het gedeelte "url = zoekalias% 3Daps & field") en de zoekwoorden die we hebben getypt (dat zijn de "keywords = wi-fi + extender "deel).
Dat is een vrij eenvoudig voorbeeld, en u zult vaak URL's zien met aanvullende (en meer gecompliceerde) variabelen. Hier is bijvoorbeeld de URL wanneer we naar Google op zoek waren naar het zoekwoord 'howtogeek':
https://www.google.com/search?q=howtogeek&rlz=1C1GCEA_enUS751US751&oq=howtogeek&aqs=chrome... 69i57j69i60l4j0.1839j1j4 & sourceid = chrome & ie = UTF-8
Zoals je kunt zien, is daar een aantal verschillende informatie. In dit geval kunt u zien dat er aanvullende informatie is over de zoektaal, de browser die we hebben gebruikt (Chrome) en zelfs het versienummer van de browser.
Fragment
Het laatste onderdeel van een URL die u mogelijk ziet, wordt een fragment genoemd. Het fragment wordt voorafgegaan door een hekje (#) en wordt gebruikt om een specifieke locatie op een webpagina aan te geven. Bij het coderen van een webpagina kunnen ontwerpers ankers maken voor specifieke tekst zoals koppen. Wanneer het juiste fragment aan het einde van een URL wordt gebruikt, laadt uw browser de pagina en springt dan naar dat anker. Ankers en URL's met fragmenten worden vaak gebruikt om inhoudstabellen op webpagina's te maken om het navigeren te vergemakkelijken.
Hier is een voorbeeld. Wikipedia's pagina over de Renaissance is een vrij lang document en het is opgedeeld in ongeveer 11 secties, die elk meerdere subsecties hebben. Maar elke kop op de pagina bevat een anker en een inhoudsopgave bovenaan het artikel bevat koppelingen waarmee u naar de verschillende secties kunt springen. Die koppelingen werken door fragmenten op te nemen.
U kunt deze fragmenten ook rechtstreeks in uw adresbalk of als deelbare links gebruiken. Stel dat u bijvoorbeeld iemand het gedeelte van die pagina wilt laten zien dat Rusland beslaat. Je zou ze gewoon deze link kunnen sturen:
https://en.wikipedia.org/wiki/Renaissance#Russia
Dat "#Russia" -gedeelte aan het einde van de URL springt ze meteen naar dat gedeelte na het laden van de pagina.
Dus daar heb je het - meer dan je waarschijnlijk ooit wilde weten over hoe URL's werken.
Beeldcredits: Pawel Horazy / Shutterstock