تعدادی از کرکترها در زبان HTML دارای مفهومی خاص هستند و استفاده از آنها در مواردی خاص جایز است. به طور مثال شما نمی توانید از کرکترهای بزرگتر از ( > ) و یا کوچکتر تر از ( < ) در داخل متون خود استفاده کنید. مرورگرها ( browser ) این حروف را به عنوان شروع و پایان یک تگ HTML می شناسند و این باعث بهم ریختگی و ایجاد اشتباه در تفسیر کدهایHTML می گردد. بنابراین برای استفاده از این نوع کرکترها در متون باید از کلمات اختصاری خاصی استفاده شود تا تفسیر گرها بتوانند تفاوت آنها را درک کنند. به طور مثال به جای استفاده از علامت ( > ) در متون خود از حروف اختصاری و خاص ( > ) استفاده نمائید.
نمونه ای دیگر از کاربرد این کرکترهای خاص ، ایجاد فاصله در بین کلمات و یا حروف است. تفسیرگرها همیشه فاصله ها را کوتاه می کنند به این معنی که اگر شما بین دو کرکتر با استفاده از space فاصله ای به اندازه ده کرکتر ایجاد کنید عملا در هنگام نمایش این فاصله به یک کرکتر کاهش می یابد.بنابر این شما نمی توانید با استفاده از space بین دو حرف یا کلمه فاصله ای به اندازه ده کرکتر و یا بیشتر از یک کرکتر ایجاد نمائید.
برای رفع این مشکل می تواند از کرکتر خاص non-breaking space ( ) استفاده نمائید و به تعداد دلخواه بین حروف فاصله ایجاد نمائید. هر ( ) نشان دهنده یک فاصله است.
Result | Description | Entity Name | Entity Number |
---|---|---|---|
non-breaking space | |   | |
< | less than | < | < |
> | greater than | > | > |
& | ampersand | & | & |
¢ | cent | ¢ | ¢ |
£ | pound | £ | £ |
¥ | yen | ¥ | ¥ |
€ | euro | € | € |
§ | section | § | § |
© | copyright | © | © |
® | registered trademark | ® | ® |
™ | trademark | ™ | ™ |
شناسه های منحصر به فردی که برای مشخص کردن محل حضور اطلاعات موجود روی شبکه ( فایل
کامپیوتری ، سند یا منابع دیگر ) به کار می روند.
آدرس ها گاهی شامل نامها و حروف هستند مانند
http://www.topdesign.ir و گاهی نیز از یک شماره IP مانند ۷۴٫۱۲۵٫۶۷٫۱۰۰ تشکیل
می شوند. وقتی می خواهید یک وب سایت را با استفاده از مرورگر خود فراخوانی کنید ،
باید نشانی سرور آن وب سایت را بدانید.
نشانی این سرور با نشانی IP ( Internet Protocol (IP) address:
74.125.67.100 ) مشخص میشود. اما به خاطر سپردن نشانی IP دشوار است.
میتوان به جای نشانی آیپی از نامهای دامنه استفاده کرد. برای هر نشانی IP یک نام
دامنه در نظر گرفته شده است. مثلا نشانی IP وب سایت گوگل ۷۴٫۱۲۵٫۶۷٫۱۰۰ است. برای
دسترسی به گوگل میتوانید از این نشانی آی پی یا نام دامنه آن یعنی
www.google.com نیز استفاده کنید. نام های
معادل هر IP توسط سیستم نام دامنه Domain Name System که
به صورت مخفف DNS ، خوانده میشود به IP مربوطه ترجمه می شوند.
DNS (Domain Name System) سلسله مراتبی برای نامگذاری رایانهها و دیگر
منابعی است که به اینترنت یا شبکههای دیگر رایانهای متصل میشوند.
url ها به صورت کلی دارای ساختار زیر می باشد.
scheme:// host.domain:port/path/filename
http://topdesign.ir/WebDesign.asp
– مشخص کننده نوع سرویس دهنده است که به طور متداول http:// است . از انواع دیگر سرویس دهنده ها می توان به ftp:// و https:// اشاره کرد.
– مشخص کننده نوع خدمات وب سات که به طور پیش فرض برای http معادل www است و می تواند نشان دهنده خدماتی چون mail و یا Usenet باشد.
– مشخص کننده نام دامنه domain مانند www.topdesign.ir
– مشخص کننده port که به طور پیش فرض برای http معادل ۸۰ است.
– مشخص کننده مسیر اطاعات و فایلها بر روی فضای میزبانی
– مشخص کننده نام فایل یا سند به همراه نوع آن
سیستم نام دامنه (Domain Name System) که به صورت مخفف DNS ، خوانده میشود سلسله مراتبی برای نامگذاری رایانهها و دیگر منابعی است که به اینترنت یا شبکههای دیگر رایانهای متصل میشوند.
با استفاده از URL Encoding کلیه URL ها دارای فرمت یکسان و استاندارد خواهند بود. طبق استانداردهای وب کرکترهای تشکیل دهنده URL ها از استاندارد ASCII استفاده میکنند.
استاندارد ASCII شامل ۱۲۸ کرکتر است و از اعداد ۱ تا ۹ ، حروف انگلیسی بزرگ و کوچک
و تعدادی از کرکتر های خاص تشکیل می شود.
هنگامی که کرکتری خارج از محدوده استاندارد ASCII در یک URL موجود باشد ، با
استفاده از URL Encoding به “%” و به دنبال آن دو رقم hexadecimal تبدیل می گردد و
یا اینکه فاصله ها در این سیستم تبدیل به “+” می شوند.
در زیر می توانید نحوه تبدیل تعدادی از کرکترهای غیر استاندارد را به سیستم ASCII ببینید .
Character | URL-encoding |
---|---|
€ | %۸۰ |
£ | %A3 |
© | %A9 |
® | %AE |
À | %C0 |
Á | %C1 |
 | %C2 |
à | %C3 |
Ä | %C4 |
Å | %C5 |
بسیاری از صفحات وب دارای کدهای HTML غیر استانداردی هستند و بنابر این بسیاری از
مرورگرها و یا ابزارهای کاربردی تحت وب مانند مرورگرهای تلفن های همراه و یا PDA ها
، برای استفاده و تفسیر این کدها دچار مشکلات فراوانی می شوند.
به طور مثال کد HTML زیر دچار مشکلات ساختاری است .
1 |
< html > |
2 |
< head > |
3 |
< title >This is bad HTML</ title > |
4 |
< body > |
5 |
< h1 >Bad HTML |
6 |
< p >This is a paragraph |
7 |
</ p ></ h1 ></ body > |
XML یک زبان علامت گذاری است که تمامی استاندارد ها برای نمایش صحیح و اجرا باید در
آن رعایت شوند و قوانین سخت گیرانه ای در این زمینه دارد.
XML یک زبان علامت گذاری برای تشریح اطلاعات است و HTML یک زبان علامت گذاری برای
نمایش اطلاعات. در بازار امروز نرم افزارها و مرورگرها نمونه های متفاوتی با ساختار
های گوناگون ساخته و به بازار عرضه می شوند. مانند مرورگرهای تلفن های همراه و یا
مرورگرهایی برای نابینایان که صفحات HTML را تبدیل به خطوط بریل می کند تا برای
نابینایان قابل درک باشد. بنابر این با توجه به گستردگی این ابزارها و نیاز به
کدهای استاندارد برای تفسیر صحیح اطلاعات توسط آنها باید قوانین سختگیرانه تری برای
استاندارد سازی کدها توسط w3c به وجود می آمد.
بنابر این سازمان W3C زبان نشانه گذاری XHTML که تکیبی از HTML و XML است را
پیشنهاد کرد تا بتواند مقداری از نیازهای آینده را نیز برآورده سازد.
همچنین XHTML 1.0 از سه الگوی DTD استفاده میکند: Strict “سختگیرانه” ، Transitional “انتقالی” و Frameset این الگو در اصل از HTML 4.0 پدیدار شد و در HTML 4.0.1 دنبال شد.
در زیر می توانید تعدادی از قوانین زبان علامت گذاری XHTML را ملاحظه نمائید
ودر اینجا نمونه ای از یک سند XHTML
01 |
html PUBLIC "-//W3C//DTD XHTML 1.0
Transitional//EN" |
03 |
04 |
< html > |
05 |
< head > |
06 |
< title >simple document</ title > |
07 |
</ head > |
08 |
< body > |
09 |
< p >a simple paragraph</ p > |
10 |
</ body > |
11 |
</ html > |