Phép ẩn dụ của mạng

Một thập kỷ sau khi phát minh ra World Wide Web, Tim Berners-Lee đang quảng cáo cho “Semantic Web”. Internet cho đến nay là một kho nội dung kỹ thuật số. Nó có một hệ thống kiểm kê thô sơ và các dịch vụ định vị dữ liệu rất thô sơ. Kết quả là phần lớn nội dung là vô hình và không thể truy cập được. Hơn nữa, Internet thao túng các chuỗi ký hiệu, không phải mệnh đề logic hoặc ngữ nghĩa. Nói cách khác, Net so sánh các giá trị nhưng không biết ý nghĩa của các giá trị mà nó thao tác. Nó không thể diễn giải các chuỗi, để suy ra các sự kiện mới, để suy luận, quy nạp, rút ​​ra hoặc hiểu được những gì nó đang làm. Trong ngắn hạn, nó không hiểu ngôn ngữ. Chạy một thuật ngữ không rõ ràng bởi bất kỳ công cụ tìm kiếm nào và những thiếu sót này trở nên rõ ràng một cách đau đớn. Sự thiếu hiểu biết về nền tảng ngữ nghĩa của nguyên liệu thô của nó (dữ liệu, thông tin) ngăn cản các ứng dụng và cơ sở dữ liệu chia sẻ tài nguyên và cung cấp cho nhau. Internet rời rạc, không liên tục. Nó giống như một quần đảo, với người dùng nhảy từ hòn đảo này sang hòn đảo khác để tìm kiếm sự liên quan một cách điên cuồng.

Ngay cả những người có tầm nhìn xa như Berners-Lee cũng không nghĩ đến một “Web thông minh”. Họ chỉ đơn giản là đề xuất cho phép người dùng, người tạo nội dung và nhà phát triển web gán thẻ meta mô tả (“tên khách sạn”) cho các trường hoặc cho chuỗi ký hiệu (“Hilton”). Các thẻ meta này (được sắp xếp theo “bản thể học” ngữ nghĩa và quan hệ – danh sách các thẻ meta, ý nghĩa của logo manchester united dream league soccer 2016 chúng và cách chúng liên quan với nhau) sẽ được các ứng dụng khác nhau đọc và cho phép chúng xử lý các chuỗi ký hiệu liên quan một cách chính xác (đặt từ ” Hilton “trong sổ địa chỉ của bạn dưới” khách sạn “). Điều này sẽ làm cho việc truy xuất thông tin hiệu quả và đáng tin cậy hơn và thông tin được truy xuất nhất định phải phù hợp hơn và có khả năng xử lý ở cấp cao hơn (thống kê, phát triển các quy tắc heuristic, v.v.). Sự thay đổi là từ HTML (có các thẻ liên quan đến sự xuất hiện trực quan và lập chỉ mục nội dung) sang các ngôn ngữ như Ngôn ngữ đánh dấu tác nhân DARPA, OIL (Lớp suy luận Ontology hoặc Ngôn ngữ trao đổi Ontology) hoặc thậm chí là XML (có các thẻ liên quan đến phân loại nội dung, cấu trúc tài liệu và ngữ nghĩa). Điều này sẽ đưa Internet đến gần hơn với danh mục thẻ thư viện cổ điển.

Ngay cả trong giai đoạn hiện tại, tiền ngữ nghĩa, phụ thuộc vào siêu kết nối, Internet vẫn gợi nhớ đến tác phẩm tiêu biểu của Richard Dawkins “The Selfish Gene” (OUP, 1976). Điều này sẽ đúng gấp đôi đối với Semantic Web.

Dawkins đề nghị khái quát nguyên tắc chọn lọc tự nhiên thành quy luật tồn tại của chuồng trại. “Một thứ ổn định là một tập hợp các nguyên tử đủ vĩnh viễn hoặc đủ phổ biến để xứng đáng được đặt tên”. Sau đó, ông tiếp tục mô tả sự xuất hiện của “Replicators” – các phân tử tạo ra các bản sao của chính chúng. Những chiếc Replicator tồn tại được trong cuộc cạnh tranh nguồn nguyên liệu thô khan hiếm được đặc trưng bởi tuổi thọ cao, độ bền và độ trung thực của việc sao chép. Các nhà nhân bản (ngày nay được gọi là “gen”) đã xây dựng các “cỗ máy sinh tồn” (sinh vật) để bảo vệ chúng khỏi sự mơ hồ của một môi trường ngày càng khắc nghiệt hơn.

Điều này rất gợi nhớ đến Internet. “Những thứ ổn định” là các trang web được mã hóa HTML. Họ là những người sao chép – họ tạo ra các bản sao của chính họ mỗi khi “địa chỉ web” (URL) của họ được nhấp vào. Mã HTML của một trang web có thể được coi là “vật chất di truyền”. Nó chứa tất cả thông tin cần thiết để tái tạo trang. Và, chính xác như trong tự nhiên, tuổi thọ, tính phong phú (được đo bằng các liên kết đến trang web từ các trang web khác) và độ trung thực của mã HTML càng cao – cơ hội tồn tại (như một trang web) càng cao.