নেটওয়ার্ক প্যাকেট ব্রোকারে ডেটা মাস্কিং প্রযুক্তি এবং সমাধান কী?

1. ডেটা মাস্কিং এর ধারণা

ডেটা মাস্কিং ডেটা মাস্কিং নামেও পরিচিত। যখন আমরা মাস্কিং নিয়ম এবং নীতি দিয়ে থাকি তখন মোবাইল ফোন নম্বর, ব্যাঙ্ক কার্ড নম্বর এবং অন্যান্য তথ্যের মতো সংবেদনশীল ডেটা রূপান্তর, পরিবর্তন বা কভার করার এটি একটি প্রযুক্তিগত পদ্ধতি। এই কৌশলটি প্রাথমিকভাবে অনির্ভরযোগ্য পরিবেশে সরাসরি ব্যবহার করা থেকে সংবেদনশীল ডেটা প্রতিরোধ করতে ব্যবহৃত হয়।

ডেটা মাস্কিং নীতি: ডেটা মাস্কিংয়ের মূল ডেটা বৈশিষ্ট্য, ব্যবসায়িক নিয়ম এবং ডেটা প্রাসঙ্গিকতা বজায় রাখা উচিত যাতে পরবর্তী বিকাশ, পরীক্ষা এবং ডেটা বিশ্লেষণ মাস্কিং দ্বারা প্রভাবিত না হয়। মাস্ক করার আগে এবং পরে ডেটা সামঞ্জস্য এবং বৈধতা নিশ্চিত করুন।

2. ডেটা মাস্কিং শ্রেণীবিভাগ

ডেটা মাস্কিংকে স্ট্যাটিক ডেটা মাস্কিং (SDM) এবং ডাইনামিক ডেটা মাস্কিং (DDM) এ ভাগ করা যায়।

স্ট্যাটিক ডেটা মাস্কিং (SDM): স্ট্যাটিক ডেটা মাস্কিং উৎপাদন পরিবেশ থেকে বিচ্ছিন্ন করার জন্য একটি নতুন অ-উৎপাদন পরিবেশ ডাটাবেস প্রতিষ্ঠার প্রয়োজন। সংবেদনশীল তথ্য উৎপাদন ডাটাবেস থেকে বের করা হয় এবং তারপর অ-উৎপাদন ডাটাবেসে সংরক্ষণ করা হয়। এইভাবে, সংবেদনশীল ডেটা উৎপাদন পরিবেশ থেকে বিচ্ছিন্ন করা হয়, যা ব্যবসার চাহিদা পূরণ করে এবং উৎপাদন ডেটার নিরাপত্তা নিশ্চিত করে।

এসডিএম

ডায়নামিক ডেটা মাস্কিং (DDM): এটি সাধারণত রিয়েল টাইমে সংবেদনশীল ডেটা অসংবেদনশীল করতে উত্পাদন পরিবেশে ব্যবহৃত হয়। কখনও কখনও, বিভিন্ন পরিস্থিতিতে একই সংবেদনশীল ডেটা পড়ার জন্য মাস্কিংয়ের বিভিন্ন স্তরের প্রয়োজন হয়। উদাহরণস্বরূপ, বিভিন্ন ভূমিকা এবং অনুমতি বিভিন্ন মাস্কিং স্কিম বাস্তবায়ন করতে পারে।

ডিডিএম

ডেটা রিপোর্টিং এবং ডেটা পণ্য মাস্কিং অ্যাপ্লিকেশন

এই ধরনের পরিস্থিতিতে প্রধানত অভ্যন্তরীণ ডেটা মনিটরিং পণ্য বা বিলবোর্ড, বাহ্যিক পরিষেবা ডেটা পণ্য এবং ডেটা বিশ্লেষণের উপর ভিত্তি করে প্রতিবেদনগুলি অন্তর্ভুক্ত করে, যেমন ব্যবসায়িক প্রতিবেদন এবং প্রকল্প পর্যালোচনা।

ডেটা রিপোর্টিং পণ্য মাস্কিং

3. ডেটা মাস্কিং সমাধান

সাধারণ ডেটা মাস্কিং স্কিমগুলির মধ্যে রয়েছে: অবৈধকরণ, র্যান্ডম মান, ডেটা প্রতিস্থাপন, সিমেট্রিক এনক্রিপশন, গড় মান, অফসেট এবং রাউন্ডিং ইত্যাদি।

অবৈধকরণ: অবৈধতা এনক্রিপশন, ছেঁটে ফেলা বা সংবেদনশীল ডেটা লুকিয়ে রাখাকে বোঝায়। এই স্কিমটি সাধারণত বিশেষ চিহ্ন (যেমন *) দিয়ে বাস্তব ডেটা প্রতিস্থাপন করে। অপারেশনটি সহজ, তবে ব্যবহারকারীরা আসল ডেটার বিন্যাস জানতে পারে না, যা পরবর্তী ডেটা অ্যাপ্লিকেশনগুলিকে প্রভাবিত করতে পারে।

এলোমেলো মান: এলোমেলো মান বলতে বোঝায় সংবেদনশীল ডেটার র্যান্ডম প্রতিস্থাপন (সংখ্যাগুলি সংখ্যা প্রতিস্থাপন করে, অক্ষরগুলি অক্ষর প্রতিস্থাপন করে এবং অক্ষরগুলি অক্ষর প্রতিস্থাপন করে)। এই মাস্কিং পদ্ধতিটি একটি নির্দিষ্ট পরিমাণে সংবেদনশীল ডেটার বিন্যাস নিশ্চিত করবে এবং পরবর্তী ডেটা প্রয়োগের সুবিধা দেবে। কিছু অর্থপূর্ণ শব্দের জন্য মুখোশ অভিধানের প্রয়োজন হতে পারে, যেমন মানুষ এবং স্থানের নাম।

ডেটা প্রতিস্থাপন: ডেটা প্রতিস্থাপন নাল এবং এলোমেলো মানগুলির মাস্কিংয়ের অনুরূপ, বিশেষ অক্ষর বা র্যান্ডম মান ব্যবহার করার পরিবর্তে, মাস্কিং ডেটা একটি নির্দিষ্ট মান দিয়ে প্রতিস্থাপিত হয়।

সিমেট্রিক এনক্রিপশন: সিমেট্রিক এনক্রিপশন একটি বিশেষ বিপরীতমুখী মাস্কিং পদ্ধতি। এটি এনক্রিপশন কী এবং অ্যালগরিদমের মাধ্যমে সংবেদনশীল ডেটা এনক্রিপ্ট করে। সিফারটেক্সট বিন্যাস যৌক্তিক নিয়মে মূল ডেটার সাথে সামঞ্জস্যপূর্ণ।

গড়: গড় স্কিম প্রায়ই পরিসংখ্যানগত পরিস্থিতিতে ব্যবহার করা হয়. সাংখ্যিক তথ্যের জন্য, আমরা প্রথমে তাদের গড় গণনা করি, এবং তারপরে এলোমেলোভাবে গড়ের চারপাশে সংবেদনশীল মানগুলি বিতরণ করি, এইভাবে ডেটার যোগফল স্থির রাখা হয়।

অফসেট এবং বৃত্তাকার: এই পদ্ধতিটি র্যান্ডম শিফটের মাধ্যমে ডিজিটাল ডেটা পরিবর্তন করে। অফসেট রাউন্ডিং ডেটার নিরাপত্তা বজায় রাখার সময় পরিসরের আনুমানিক সত্যতা নিশ্চিত করে, যা পূর্ববর্তী স্কিমগুলির তুলনায় প্রকৃত ডেটার কাছাকাছি, এবং বড় ডেটা বিশ্লেষণের দৃশ্যে এর গুরুত্ব রয়েছে৷

ML-NPB-5660-数据脱敏

প্রস্তাবিত মডেল "ML-NPB-5660"ডেটা মাস্কিং এর জন্য

4. সাধারণত ব্যবহৃত ডেটা মাস্কিং কৌশল

(1)। পরিসংখ্যান কৌশল

ডেটা স্যাম্পলিং এবং ডেটা অ্যাগ্রিগেশন

- ডেটা স্যাম্পলিং: ডি-আইডেন্টিফিকেশন কৌশলগুলির কার্যকারিতা উন্নত করার জন্য ডেটা সেটের একটি প্রতিনিধি উপসেট নির্বাচন করে মূল ডেটা সেটের বিশ্লেষণ এবং মূল্যায়ন একটি গুরুত্বপূর্ণ পদ্ধতি।

- ডেটা একত্রীকরণ: পরিসংখ্যানগত কৌশলগুলির একটি সংগ্রহ হিসাবে (যেমন সমষ্টি, গণনা, গড়, সর্বাধিক এবং সর্বনিম্ন) মাইক্রোডেটার বৈশিষ্ট্যগুলিতে প্রয়োগ করা হয়, ফলাফলটি মূল ডেটা সেটের সমস্ত রেকর্ডের প্রতিনিধিত্ব করে।

(2)। ক্রিপ্টোগ্রাফি

ক্রিপ্টোগ্রাফি হল সংবেদনশীলকরণের কার্যকারিতা বাড়ানোর জন্য একটি সাধারণ পদ্ধতি। বিভিন্ন ধরনের এনক্রিপশন অ্যালগরিদম বিভিন্ন ডিসেনসিটাইজেশন প্রভাব অর্জন করতে পারে।

- ডিটারমিনিস্টিক এনক্রিপশন: একটি নন-এলোমেলো সিমেট্রিক এনক্রিপশন। এটি সাধারণত আইডি ডেটা প্রসেস করে এবং প্রয়োজনে সিফারটেক্সটটিকে মূল আইডিতে ডিক্রিপ্ট এবং পুনরুদ্ধার করতে পারে, তবে কীটি সঠিকভাবে সুরক্ষিত করা প্রয়োজন।

- অপরিবর্তনীয় এনক্রিপশন: হ্যাশ ফাংশন ডেটা প্রক্রিয়া করতে ব্যবহৃত হয়, যা সাধারণত আইডি ডেটার জন্য ব্যবহৃত হয়। এটি সরাসরি ডিক্রিপ্ট করা যাবে না এবং ম্যাপিং সম্পর্ক সংরক্ষণ করা আবশ্যক। এছাড়াও, হ্যাশ ফাংশনের বৈশিষ্ট্যের কারণে, ডেটা সংঘর্ষ ঘটতে পারে।

- হোমোমরফিক এনক্রিপশন: সাইফারটেক্সট হোমোমরফিক অ্যালগরিদম ব্যবহার করা হয়। এর বৈশিষ্ট্য হল যে সাইফারটেক্সট অপারেশনের ফলাফল ডিক্রিপশনের পরে প্লেইনটেক্সট অপারেশনের মতোই। অতএব, এটি সাধারণত সংখ্যাসূচক ক্ষেত্রগুলি প্রক্রিয়া করতে ব্যবহৃত হয়, তবে কার্যকারিতার কারণে এটি ব্যাপকভাবে ব্যবহৃত হয় না।

(3)। সিস্টেম প্রযুক্তি

দমন প্রযুক্তি গোপনীয়তা সুরক্ষা পূরণ করে না এমন ডেটা আইটেমগুলি মুছে দেয় বা রক্ষা করে, তবে সেগুলি প্রকাশ করে না।

- মাস্কিং: এটি অ্যাট্রিবিউটের মানকে মাস্ক করার জন্য সবচেয়ে সাধারণ ডিসেনসিটাইজেশন পদ্ধতিকে বোঝায়, যেমন প্রতিপক্ষের নম্বর, আইডি কার্ড একটি তারকাচিহ্ন দিয়ে চিহ্নিত করা হয়, বা ঠিকানাটি কাটা হয়।

- স্থানীয় দমন: নির্দিষ্ট বৈশিষ্ট্য মান (কলাম) মুছে ফেলার প্রক্রিয়া বোঝায়, অপ্রয়োজনীয় ডেটা ক্ষেত্রগুলি অপসারণ করে;

- রেকর্ড দমন: নির্দিষ্ট রেকর্ড (সারি) মুছে ফেলার প্রক্রিয়া বোঝায়, অপ্রয়োজনীয় ডেটা রেকর্ড মুছে ফেলা।

(4)। ছদ্মনাম প্রযুক্তি

সিউডোম্যানিং হল একটি ডি-আইডেন্টিফিকেশন কৌশল যা সরাসরি শনাক্তকারী (বা অন্যান্য সংবেদনশীল শনাক্তকারী) প্রতিস্থাপন করতে একটি ছদ্মনাম ব্যবহার করে। ছদ্মনাম কৌশল সরাসরি বা সংবেদনশীল শনাক্তকারীর পরিবর্তে প্রতিটি পৃথক তথ্য বিষয়ের জন্য অনন্য শনাক্তকারী তৈরি করে।

- এটি মূল আইডির সাথে মিল রাখতে, ম্যাপিং টেবিলটি সংরক্ষণ করতে এবং ম্যাপিং টেবিলের অ্যাক্সেস কঠোরভাবে নিয়ন্ত্রণ করতে স্বাধীনভাবে র্যান্ডম মান তৈরি করতে পারে।

- আপনি ছদ্মনাম তৈরি করতে এনক্রিপশনও ব্যবহার করতে পারেন, তবে ডিক্রিপশন কীটি সঠিকভাবে রাখতে হবে;

এই প্রযুক্তিটি বিপুল সংখ্যক স্বাধীন ডেটা ব্যবহারকারীর ক্ষেত্রে ব্যাপকভাবে ব্যবহৃত হয়, যেমন ওপেন প্ল্যাটফর্মের দৃশ্যে OpenID, যেখানে বিভিন্ন ডেভেলপার একই ব্যবহারকারীর জন্য বিভিন্ন Openid প্রাপ্ত করে।

(5)। সাধারণীকরণ কৌশল

সাধারণীকরণ কৌশল একটি ডি-শনাক্তকরণ কৌশলকে বোঝায় যা একটি ডেটা সেটে নির্বাচিত বৈশিষ্ট্যগুলির গ্রানুলারিটি হ্রাস করে এবং ডেটার আরও সাধারণ এবং বিমূর্ত বিবরণ প্রদান করে। সাধারণীকরণ প্রযুক্তি প্রয়োগ করা সহজ এবং রেকর্ড-স্তরের ডেটার সত্যতা রক্ষা করতে পারে। এটি সাধারণত ডেটা পণ্য বা ডেটা রিপোর্টে ব্যবহৃত হয়।

- রাউন্ডিং: নির্বাচিত বৈশিষ্ট্যের জন্য একটি রাউন্ডিং বেস নির্বাচন করা জড়িত, যেমন ঊর্ধ্বগামী বা নিম্নমুখী ফরেনসিক, ফলাফল 100, 500, 1K, এবং 10K

- উপরের এবং নীচের কোডিং কৌশল: থ্রেশহোল্ডের উপরে (বা নীচে) মানগুলিকে একটি থ্রেশহোল্ড দিয়ে প্রতিস্থাপন করুন যা উপরের (বা নীচে) স্তরের প্রতিনিধিত্ব করে, "এক্সের উপরে" বা "এক্সের নীচে" এর ফলাফল দেয়।

(6)। র্যান্ডমাইজেশন কৌশল

এক ধরণের ডি-আইডেন্টিফিকেশন কৌশল হিসাবে, র্যান্ডমাইজেশন প্রযুক্তি বলতে র্যান্ডমাইজেশনের মাধ্যমে একটি বৈশিষ্ট্যের মান পরিবর্তন করা বোঝায়, যাতে র্যান্ডমাইজেশনের পরের মান আসল আসল মান থেকে আলাদা হয়। এই প্রক্রিয়াটি একই ডেটা রেকর্ডে অন্যান্য অ্যাট্রিবিউট মান থেকে একটি অ্যাট্রিবিউট মান আহরণ করার জন্য আক্রমণকারীর ক্ষমতা হ্রাস করে, তবে ফলাফলের ডেটার সত্যতাকে প্রভাবিত করে, যা উত্পাদন পরীক্ষার ডেটার সাথে সাধারণ।


পোস্টের সময়: সেপ্টেম্বর-27-2022