القائمة الرئيسية

الصفحات

دراسة مقارنة بين الطرق المختلفة من ضغط الملف

 

دراسة مقارنة بين الطرق المختلفة من ضغط الملف


تمهيد حول دراسة مقارنة بين الطرق المختلفة من ضغط الملف


أدى انتشار أجهزة الكمبيوتر إلى انفجار هائل في حجم هذا البيانات التي نريد تنفيذها في عملية تخزينها داخل محركات الأقراص الثابتة و مشاركتها أيضًا عبر الإنترنت. أدى هذا النمو الهائل في البيانات إلى الحاجة لضغط تلك البيانات ، وهذه العملية تعني القدرة على تقليل حجم ملف الملف الأصلي أو النطاق الترددي للإنترنت للتعامل مع تلك البيانات. تقدم هذه الورقة مسح من تقنيات ضغط البيانات. ينصب التركيز على أبرز البيانات "أنظمة الضغط" ، وأهم هذه الامتدادات هي .DOC ، .TXT و. BMP و. شائعة الاستخدام على نطاق واسع TIF و .GIF و .JPG. باستخدام خاص الخوارزميات التي تؤدي عملية ضغط مختلفة للحصول على بعض النتائج و فيما يتعلق بهذه النتائج ، نقترح خوارزمية فعالة لاستخدامها مع يتم ضغط نوع معين من الملفات مع معرفة كل من نسبة الضغط وحجم الملف المضغوط قد تعمل هذه الميزات على تقليل حجم الملف من 1.4 جيجا بايت إلى أقل من 400 ميجا بايت للتحميل على الإنترنت وتخزينه على الجهاز مع توفير مساحة للقرص الصلب .


المقدمة


تُعرف النسبة الأساسية للجدارة إلى ضغط البيانات باسم "نسبة الضغط" ، أو نسبة حجم ضغط الملف إلى الملف الأصلي غير المضغوط. على سبيل المثال ، نحن افترض أن ملف البيانات هو 100 كيلو بايت. باستخدام عملية الضغط ، فإن ملف يمكن تقليل حجم هذا الملف إلى 50 كيلوبايت ، مما يسهل تخزين القرص ويوفر المساحة ، وهو أيضًا أسرع في الإرسال عبر شبكة الويب العالمية. في هذه الحالة ، البيانات برنامج الضغط يقلل من حجم البيانات ، برنامج الضغط يقلل من حجم البيانات ، مما أدى إلى "نسبة ضغط" 2: 1. هناك أشكال "خسارة" و "خسارة" بيانات مضغوطة. يستخدم ضغط البيانات عملية بدون فقدان البيانات عندما تكون البيانات غير مضغوطة تمامًا ، يتم تخزين الملفات النصية دون فقد تقنياتها ، يتم تخزين المصادر الرئيسية للصور وبيانات الفيديو ، وينبغي أن يتم تخزين البيانات الصوتية بشكل عام يكون بدون خسارة كذلك. ومع ذلك ، هناك حدود لمقدار الضغط الذي يمكن الحصول عليه عن طريق الضغط دون فقد البيانات و تتراوح نسب الضغط عمومًا من 2: 1 إلى 8: 1 بالنسبة إلى الخسارة تعمل عملية الضغط على افتراض أنه لا يجب تخزين البيانات تماما يمكنك أيضًا التخلص ببساطة من الكثير من المعلومات ، سواء من الصور أو بيانات الفيديو ويمكن أن تكون نسب ضغط البيانات الصوتية أكبر في الحجم من تلك المتوفرة بدونها طرق بلا ضياع السؤال "أفضل" ، دون ضياع أو ضياع التكنولوجيا؟ خسارة وتقنيات تصغير الحجم غالبًا ما تُستخدم معًا للحصول على أعلى مستوى ممكن نسب الضغط. يمكن أن تؤثر قوة التأثير على نسبة الضغط. في بعض الحالات، . باستخدام بعض تقنيات ضغط البيانات .


ملفات الكمبيوتر


منذ تأسيس الحاسبات وبداية ظهورها و إنشاء ، بدأوا في تضمين العديد من الوسائل التكنولوجية المختلفة هذه الوسائل التكنولوجية ، وهي من أهم الركائز والأركان تسهل على المستخدم الكثير من الوقت والجهد ، ومن بين أهمها من نظام الكمبيوتر ، تسمى ملفات الكمبيوتر ، وهي من بين أكثر الملفات أجزاء مهمة من المعلومات للاستخدام المستقل ومتاحة بشكل أساسي على أنظمة تشغيل الكمبيوتر ، بالإضافة إلى البرامج ذات الخصائص الفردية ، تتضمن البرامج عددًا من الملفات الفردية المسؤولة عن الفهم و تنفيذ المحتويات  والمعلومات بشكل جيد. الحوسبة الحاسوبية متعددة و تنسيقات مختلفة يتم تحديدها وتحديدها من خلال معرفة الملف الأساسي ، على الرغم من وجود العديد من ملفات الكمبيوتر التي لها تنسيق مشابه في شروط التمديد وملفات الكمبيوتر التي يتم تنشيطها واستخدامها على مختلف أنظمة تشغيل الكمبيوتر لها ميزات محددة ومحددة مثل القراءة الميزة فقط التي لا تسمح للمستخدم بكتابة معلومات وبيانات جديدة في هذا file ، ومن أهم ميزات هذه الملفات اسم الملف ، مما يساعد المستخدم بشكل كبير وأساسي في تحديد محتوى الملف بالإضافة إلى موقع الملف على نظام التشغيل ، وتحتوي ملفات الكمبيوتر العديد من الميزات التي يتم استخدامها وأهم هذه الميزات هو الملف طريقة الضغط التي تضيف السرعة في الأداء وتوفر جهدًا لـ المستخدم


ملف مضغوط


إنه ملف تم تطبيقه على عملية الضغط ، وقد تم تصغير حجمه وتوفير مساحة إضافية على القرص الصلب ، وإمكانية مشاركة هذا الملف أيضًا على الإنترنت بسهولة مع الحفاظ على المعلومات الواردة فيه كما هو الحال في الداخل ، ويمكن أيضًا استخدام الملف المضغوط تمامًا مثل استخدام الملفات الأخرى ، ملف عملية الضغط لن تؤثر عليها وعلى استخدامها. عندما يكون الملف المضغوط مفتوحًا ، يقوم Windows تلقائيًا بضغط الملف لقراءته واستخدامه مرة أخرى ، و عند إغلاق الملف ، سيقوم هذا الملف بتحويل عملة الضغط الخاصة به مرة أخرى للعودة كما كان من قبل ، ويتم تحديثه تلقائيًا بغض النظر عن عدد الملفات. كان الجرذ فتح فيه هذا الملف وإغلاقه. أيضا ، توفر عملية ضغط الملفات مساحة للقرص الصلب لاستخدامها قدر الإمكان. على سبيل المثال ، متى ضغط ملف بامتداد DOC 10 ميجابايت ، يصبح حجمه بعد ملف عملية ضغط 5 ميغا بايت فقط ، لذلك يمكنك تخيل مقدار المساحة التي المقدمة في حالة عملية ضغط مجموعة ملفات كبيرة الحجم أيضًا يوفر عملية ضغط الملفات وخاصة الملفات التي تحمل ملف PDF تمديد لواحد للسماح بإرساله عبر البريد الإلكتروني بسهولة ودون تعقيدات ، مثل هذا النوع من الملفات عادة ما يكون بحجم كبير ولا يمكن إرساله كما هو عبر البريد الإلكتروني ، فهو تجدر الإشارة أيضًا إلى p عند البحث عن الملفات المضغوطة ، فإنها تظهر بامتداد النص الأزرق لتمييزها عن الملفات العادية ، وهذه ميزة أكثر من غيرها تستخدم أجهزة كمبيوتر Windows.

خاصية الضغط العالي


يمكن فك ضغط الملفات ، ثم ضغطها مرة أخرى في أرشيف "ZIP". هذا يؤدي إلى عملية ضغط ملفات كبيرة. بشكل عام ، أدوات الأرشفة مثل "WinRar" و يحتوي "WinZip" على خيارات مصممة لزيادة معدل الضغط في الملفات ، و كما أنها تحتوي على خيارات متنوعة تتعلق بمسائل ضغط الملفات النهائية.

أفضل نظام لضغط الملفات


يوصى بضغط الملفات إلى "7-Zip" بدلاً من الأداة المساعدة ، لأن هذا يحتوي على معدل ضغط أفضل بالإضافة إلى القدرة على التعامل مع الملفات التي تحتاج لوقت طويل وقت الضغط وهذه الملفات كبيرة وبطيئة وحدات المعالجة المركزية ، ومع ذلك لا يمكن "7-Zip" ضغط المساحات الكبيرة ، وهذا هو السبب في أنه من الأفضل دائمًا الحفاظ على وضعها الطبيعي مستوى الضغط .

تقنية الترميز Hofmann


تُعرف تقنية الضغط غير المفقودة الأكثر تطوراً وفعالية باسم "تشفير هوفمان" ، حيث يتم تحويل الأحرف الموجودة في ملف البيانات إلى ثنائي الكود ، حيث تحتوي الأحرف الأكثر شيوعًا في الملف على أقصر الرموز الثنائية ، والأقل شيوعًا هو الأطول. لنرى كيف يعمل ترميز هوفمان ، افترض أن ملفًا نصيًا سيتم ضغطه ، وأن الأحرف الموجودة في الملف لها الامتداد الترددات التالية:

A: 29
B: 64
C: 32
D: 12
E: 9
F: 66
G: 23

من الناحية العملية ، نحتاج إلى الترددات لجميع الأحرف المستخدمة في النص ، بما في ذلك كل الحروف والأرقام وعلامات الترقيم ، ولكن لتبسيط المثال ، سنلتزم به الأحرف من A إلى G. الخطوة الأولى في بناء كود Huffman هي طلب عدد الأحرف من الأعلى إلى الأقل تكرارًا على النحو التالي:

66 64 32 29 23 12 9
F B C A G D E

تقنية الترميز الحسابي


يعد ترميز Huffman خاصًا جدًا لأنه منظم وأنيق للغاية ، و التكنولوجيا الحديثة في ضغط البيانات هي ترميز حسابي وليس هوفمان طريقة. يوفر الترميز الحسابي ضغطًا أكبر وهو أيضًا أحد أسرع أنواع النماذج التكيفية. معبراً بكسور : 

A: 0.5
B: 0.2
C: 0.3

لإظهار كيفية عمل الضغط الحسابي ، يجب علينا أولاً تعيينه في الجزء العلوي من ملف الجدول ، ثم يتم سرد الشخصيات مع احتمالاتها مع النهائي المجموع التراكمي لتلك الاحتمالات. تم تحديد "الفاصل الزمني" التراكمي ، بدءًا من أدنى قيمة إلى أدنى قيمة أعلى قيمة ولكن لا تساويها. لا يبدو أنه مهم


تقنية التشفير LZ77


نقدم تقنية الترميز باستخدام طريقة الضغط LZ77. باستخدام الطرق المستخدمة ، يتم ترميز الأجزاء المتكررة من النص كأزواج مسافات طويلة و تشير هذه الأزواج إلى النص الذي تمت رؤيته مسبقًا. بشكل عام ، من خلال النظر إلى الحد الأقصى لطول هذا الجزء المتكرر ، قد يكون هناك أكثر من مسافة في وهي نسخة من الجزء المكرر. الضاغط مجاني لضبط أي جزء منه هذه المسافات يستعيد برنامج إلغاء الضغط نفس النص على أي حال إذا كان كذلك ضائع. تظهر التجارب أن طريقتنا تحسن الضغط بشكل كبير معدلات للعديد من ملفات كالجاري

في البداية ، بدأ نظام LZ-77 عملية الإنتاج غير المضغوط الأحرف ، ومنذ ذلك الحين لم تكن هناك حالات سابقة لأي سلاسل لـ تشير إلى الوراء. في هذا المثال التالي ، لن تكون هذه الأحرف التالية مضغوط:

the_rain_

الجزء التالي من الرسالة:

in_

حدث هذا سابقًا في تلك الرسالة ويمكن أن يكون مؤشرًا على النص السابق ، مع العلامة التي تحتوي على حقل الطول. هذا يعطي 

the_rain_<3,3>

نظرًا لأن هذا الأمر يعني بناء الجملة ، "انظر إلى الوراء ثلاثة أحرف وخذ ثلاثة أحرف من تلك النقطة." هناك نوعان مختلفان من الصيغ الثنائية للمؤشر





تعليقات