84gg.com
vị trí của bạn:Bây giờTrang chủ > công nghệ > Sử dụng AI để giải mã nhanh chữ viết hình nêm từ 5.000 năm trước

Sử dụng AI để giải mã nhanh chữ viết hình nêm từ 5.000 năm trước

thời gian:2024-05-29 17:56:19 Nhấp chuột:162 hạng hai
{1[The Epoch Times, ngày 10 tháng 12 năm 2023] (Wu Ruichang, phóng viên Ban Đặc biệt của Đại Kỷ Nguyên, biên soạn và báo cáo) Hầu hết các tấm bảng chữ nêm được khai quật từ nền văn minh Lưỡng Hà ở Iran vẫn chưa được giải mã. Gần đây, các nhà khoa học Đức đã bắt đầu sử dụng AI để giải mã nội dung của những tấm đất sét này và được kỳ vọng sẽ giải mã được một cách nhanh chóng.

Nền văn minh Lưỡng Hà cùng với Trung Quốc cổ đại, Ấn Độ cổ đại và Ai Cập cổ đại được gọi là bốn nền văn minh cổ đại lớn. Nền văn minh cổ đại bắt đầu sử dụng tiếng Sumer khoảng 5.000 năm trước, và cuối cùng được thay thế bởi tiếng Akkadian, nhưng cả hai ngôn ngữ đều được viết bằng chữ hình nêm. Người Sumer được coi là một trong những chủng tộc sử dụng chữ viết hình nêm sớm nhất trên thế giới. viết trên tấm bảng (tấm đất sét).

Vào thời điểm đó, người Sumer đã chiếm đóng Iraq hiện đại, một phần của Iran, Kuwait, Syria và Thổ Nhĩ Kỳ. Nền văn minh này chính thức kết thúc vào khoảng năm 2004 trước Công nguyên và dần dần hòa nhập vào các thành bang Amorite cho đến khi bị phá hủy vào thế kỷ 18 trước Công nguyên. Nền văn minh Babylon thay thế. Vì vậy, những tấm bảng chữ nêm còn sót lại không chỉ được viết bằng nhiều ngôn ngữ mà còn có niên đại hàng nghìn năm.

Các chuyên gia khảo cổ học ước tính rằng vẫn còn một triệu tấm bảng đất sét trên thế giới, nhưng chữ viết hình nêm còn sót lại đòi hỏi các nhà khảo cổ học phải thực hiện công việc tẻ nhạt để dịch và lập danh mục nội dung trên các tấm bảng đất sét. văn bản chữ hình nêm vẫn chưa được dịch.

新车数据反映了市场需求曲线,新型混合动力汽车的销售速度快于普通车型,而新型电动汽车的销售速度较慢。一年前,新电动汽车在短短二十多天内就从经销商处发货。现在,电动汽车的平均销售时间为57.5 天,几乎是原来的三倍。

而量子电脑目前还未能真正投入实际应用,且稳定性相较于一般的电脑还要差。原因是它体积庞大、运算不准确、消耗巨大的能源,且需要极低温的情况才能运作,对于环境还特别的敏感。目前的AI则是依靠现有的芯片、电脑和大数据去提升算力,因此算力方面仍是有限的。

这些鲜艳的云高挂在北极圈的高空,在挪威、瑞典、芬兰、美国阿拉斯加州、甚至英国苏格兰都看得到。

“奔鸡星云”位于半人马座,距离地球大约6,500光年。它也称为半人马座λ星云,因为它就在该星座的恒星“半人马座λ星”(又称海山五)附近。

这张图片是个有趣的例子。它告诉人们,从地球的视角来看,很难判断两个看似相近的星系是否真的相互靠近。

Từ nội dung của các tấm đất sét được làm sáng tỏ trong quá khứ, chúng ta có thể thấy rằng chúng bao gồm từ chi tiết về việc xây dựng các ngôi đền kỳ công cho đến những khiếu nại về dịch vụ của những khách hàng không hài lòng với việc giao quặng đồng. Nếu những nội dung này có thể được giải thích trong tương lai, nó sẽ giúp con người hiện đại hiểu được chi tiết về cuộc sống cổ xưa và những thay đổi lịch sử cách đây 5.000 năm.

Để đạt được mục tiêu này, nhóm Martin-Luther-Universität Halle-Wittenberg (MLU), Đại học Johannes Gutenberg và Đại học Khoa học Ứng dụng Mainz (Đại học Khoa học Ứng dụng Mainz) đã đưa ra giải pháp dịch thuật.

Nhóm đã huấn luyện máy tính AI cách xác định và học ngôn ngữ Sumer và Akkadian của nền văn minh Lưỡng Hà, sau đó cho máy xác định các ký tự chữ hình nêm 3D này để phân tích nhanh nội dung trên các tấm đất sét. Nghiên cứu này đã được viết thành một bài báo và được công bố trong Hội nghị chuyên đề châu Âu về đồ họa và di sản văn hóa vào cuối tháng 11.

Vì loại chữ viết hình nêm này được thể hiện dưới dạng 3D trên tấm đất sét nên chất lượng của nó đã bị ảnh hưởng nghiêm trọng do sự hao mòn của thời gian và quá trình xử lý tấm đất sét. Do đó, rất khó để quét nó vào. một chiếc máy tính trong quá khứ, cung cấp cho các nhà sử học và khảo cổ học tiến hành nghiên cứu và dịch thuật.

Ngoài ra, những tấm đất sét như vậy thường không có ngữ cảnh, thường chỉ có một chuỗi nội dung văn bản nhỏ nên các nhà khảo cổ khó giải mã được ý nghĩa thực sự ban đầu của chúng, giống như việc người ta cố gắng hiểu một câu nhỏ bằng cách đọc một cuốn sách. Nội dung của toàn bộ cuốn sách là như nhau.

Do đó, các nhà nghiên cứu của nhóm này đã sử dụng mô hình 3D của gần 2.000 bảng chữ nêm cho AI để tìm hiểu và nhận dạng, đồng thời nhập 21.000 ký hiệu và 4.700 ký hiệu chữ nêm vào chương trình AI để tạo ra bộ dữ liệu mới. có thể được sử dụng bởi các nhà nghiên cứu khác muốn nghiên cứu chữ hình nêm và dữ liệu được AI sử dụng hầu hết được cung cấp bởi Đại học Khoa học Ứng dụng Mainz.

Hệ thống AI mới do nhóm

phát triển có thể bẻ khóa ký tự tốt hơn các phương pháp trước đó. Nguyên lý hoạt động của nó về cơ bản giống như phần mềm nhận dạng ký tự quang học (OCR), phần mềm chuyển đổi các từ và văn bản viết thành dạng văn bản có thể đọc được bằng máy. Cách tiếp cận này có nhiều ưu điểm. Sau khi được chuyển đổi sang văn bản máy tính, văn bản có thể dễ đọc hoặc tìm kiếm hơn.

AI sẽ phân tách văn bản chữ nêm trong quá trình làm việc, đảm bảo rằng mỗi ký hiệu sẽ được cắt thành một hình ảnh duy nhất để có thể nhận dạng và học hỏi văn bản chữ nêm. Sau đó, nhân viên sẽ sửa lỗi và để AI​. tiếp tục nhận dạng nó.

Để kiểm tra độ tin cậy của loại AI này, họ đã yêu cầu AI xác định những tấm đất sét khác chưa xác định được danh tính. Kết quả cho thấy AI có thể phát hiện chính xác các ký tự và ký hiệu chữ nêm, với độ chính xác lên tới 76%.

Mặc dù độ chính xác của AI trong một số trường hợp vẫn cần phải cải thiện do một số văn bản bị biến dạng hoặc bị chồng lên nhau khiến AI không thể nhận dạng bình thường, nhưng độ chính xác của việc nhận dạng văn bản 3D trên ảnh tấm đất sét sẽ được cải thiện sau AI đã được đào tạo nhiều lần. Ngoài ra, khả năng phân tích của AI không chỉ áp dụng được cho những viên đất sét được bảo quản tốt mà còn có thể xác định những viên đất sét được bảo quản kém.

Aces & Eights 10 Hand

Ernst Stötzner, sinh viên thạc sĩ tại MLU, giải thích với phòng tin tức của trường đại học, "Công nghệ OCR thường phù hợp với ảnh hoặc bản quét, và việc bôi mực lên giấy tờ tùy thân hoặc giấy da không có vấn đề gì, nhưng nó trở nên rất khó thực hiện." xác định các ký tự hình nêm trên các tấm đất sét, vì ánh sáng và góc nhìn khi chụp ảnh những tấm đất sét này sẽ ảnh hưởng lớn đến việc nhận dạng một số ký tự nhất định.”

Anh ấy tiếp tục nói: “Tuy nhiên, chúng tôi rất ngạc nhiên khi thấy rằng hệ thống do nhóm phát triển có thể xử lý rất tốt những bức ảnh tấm đất sét này và những bức ảnh này thực sự là một nguồn nguyên liệu kém (các tấm đất sét hầu hết bị hư hỏng ) ."

Hubert Mara, trợ lý giáo sư tại MLU và là tác giả của bài báo, cho biết: “Những chiếc máy tính bảng này có thể cho chúng ta cái nhìn thoáng qua về quá khứ của loài người hàng nghìn năm trước. Chúng ta có thể tìm thấy nhiều thứ trên máy tính bảng, từ danh sách mua sắm cho đến tòa án. nhưng chúng đã bị phong hóa nặng nên việc giải mã nội dung của các tấm bảng chữ nêm rất khó khăn."

Các nhà nghiên cứu cho biết hiện có 12 chữ viết hình nêm được biết đến, nhưng hiện tại AI chỉ có thể xác định chính xác nguyên mẫu của hai ký hiệu ngôn ngữ.. Tuy nhiên, với sự phát triển và học hỏi không ngừng của AI, nó có thể xác định được nhiều ký tự chữ nêm hơn trong tương lai và thậm chí giúp giải mã các dòng chữ khắc bị phong hóa nghiêm trọng, bởi vì những dòng chữ này, giống như các ký tự chữ nêm, đều có ba chiều.

Nhóm dự định sử dụng số lượng mẫu viên đất sét lớn hơn để huấn luyện AI trong tương lai nhằm đạt được kết quả đọc chính xác hơn vì họ nghi ngờ rằng số lượng mẫu viên đất sét tương đối nhỏ có thể hạn chế khả năng của AI. Ngoài ra, họ hy vọng có thể cắt hình ảnh trong các mẫu viên đất sét thành những phần nhỏ hơn để AI cần xử lý ít thông tin hơn nhằm cải thiện độ chính xác. ◇

Biên tập viên: Lian Shuhua#

Đường dây nóng dịch vụ
Trang web chính thức:qmc800.com
Thời gian hoạt động:Thứ Hai đến Thứ Bảy(09:00-18:00)
liên hệ chúng tôi
URL:www.qmc800.com
Theo dõi tài khoản công khai

Powered by Bây giờTrang chủ bản đồ RSS bản đồ HTML

Copyright 站群系统 © 2013-2024 SABA E-SPORTS Đã đăng ký Bản quyền