১. ডেটা মাস্কিংয়ের ধারণা
ডেটা মাস্কিংকে ডেটা মাস্কিংও বলা হয়। এটি একটি প্রযুক্তিগত পদ্ধতি যা মোবাইল ফোন নম্বর, ব্যাংক কার্ড নম্বর এবং অন্যান্য তথ্যের মতো সংবেদনশীল ডেটা রূপান্তর, পরিবর্তন বা কভার করার জন্য ব্যবহৃত হয় যখন আমরা মাস্কিংয়ের নিয়ম এবং নীতিমালা দিয়ে থাকি। এই কৌশলটি মূলত অবিশ্বাস্য পরিবেশে সরাসরি সংবেদনশীল ডেটা ব্যবহার রোধ করার জন্য ব্যবহৃত হয়।
ডেটা মাস্কিং নীতি: ডেটা মাস্কিং-এর মূল ডেটা বৈশিষ্ট্য, ব্যবসায়িক নিয়ম এবং ডেটা প্রাসঙ্গিকতা বজায় রাখা উচিত যাতে পরবর্তী উন্নয়ন, পরীক্ষা এবং ডেটা বিশ্লেষণ মাস্কিংয়ের দ্বারা প্রভাবিত না হয়। মাস্কিংয়ের আগে এবং পরে ডেটার ধারাবাহিকতা এবং বৈধতা নিশ্চিত করুন।
2. ডেটা মাস্কিং শ্রেণীবিভাগ
ডেটা মাস্কিংকে স্ট্যাটিক ডেটা মাস্কিং (SDM) এবং ডাইনামিক ডেটা মাস্কিং (DDM) এ ভাগ করা যায়।
স্ট্যাটিক ডেটা মাস্কিং (SDM): স্ট্যাটিক ডেটা মাস্কিংয়ের জন্য উৎপাদন পরিবেশ থেকে বিচ্ছিন্ন করার জন্য একটি নতুন নন-প্রোডাকশন এনভায়রনমেন্ট ডাটাবেস স্থাপন করা প্রয়োজন। সংবেদনশীল ডেটা উৎপাদন ডাটাবেস থেকে বের করা হয় এবং তারপর নন-প্রোডাকশন ডাটাবেসে সংরক্ষণ করা হয়। এইভাবে, সংবেদনশীল ডেটা উৎপাদন পরিবেশ থেকে বিচ্ছিন্ন করা হয়, যা ব্যবসায়িক চাহিদা পূরণ করে এবং উৎপাদন ডেটার নিরাপত্তা নিশ্চিত করে।
ডায়নামিক ডেটা মাস্কিং (DDM): এটি সাধারণত উৎপাদন পরিবেশে সংবেদনশীল ডেটা রিয়েল টাইমে সংবেদনশীলতা হ্রাস করার জন্য ব্যবহৃত হয়। কখনও কখনও, বিভিন্ন পরিস্থিতিতে একই সংবেদনশীল ডেটা পড়ার জন্য বিভিন্ন স্তরের মাস্কিংয়ের প্রয়োজন হয়। উদাহরণস্বরূপ, বিভিন্ন ভূমিকা এবং অনুমতি বিভিন্ন মাস্কিং স্কিম বাস্তবায়ন করতে পারে।
ডেটা রিপোর্টিং এবং ডেটা পণ্য মাস্কিং অ্যাপ্লিকেশন
এই ধরনের পরিস্থিতিতে প্রধানত অভ্যন্তরীণ ডেটা পর্যবেক্ষণ পণ্য বা বিলবোর্ড, বহিরাগত পরিষেবা ডেটা পণ্য এবং ডেটা বিশ্লেষণের উপর ভিত্তি করে প্রতিবেদন, যেমন ব্যবসায়িক প্রতিবেদন এবং প্রকল্প পর্যালোচনা অন্তর্ভুক্ত থাকে।
৩. ডেটা মাস্কিং সলিউশন
সাধারণ ডেটা মাস্কিং স্কিমগুলির মধ্যে রয়েছে: অবৈধকরণ, এলোমেলো মান, ডেটা প্রতিস্থাপন, প্রতিসম এনক্রিপশন, গড় মান, অফসেট এবং রাউন্ডিং ইত্যাদি।
অবৈধকরণ: অবৈধকরণ বলতে সংবেদনশীল ডেটা এনক্রিপশন, কাটছাঁট বা লুকানো বোঝায়। এই স্কিমটি সাধারণত আসল ডেটাকে বিশেষ প্রতীক (যেমন *) দিয়ে প্রতিস্থাপন করে। অপারেশনটি সহজ, তবে ব্যবহারকারীরা মূল ডেটার ফর্ম্যাট জানতে পারে না, যা পরবর্তী ডেটা অ্যাপ্লিকেশনগুলিকে প্রভাবিত করতে পারে।
র্যান্ডম মান: এলোমেলো মান বলতে সংবেদনশীল তথ্যের এলোমেলো প্রতিস্থাপনকে বোঝায় (সংখ্যা সংখ্যা প্রতিস্থাপন করে, অক্ষর অক্ষর প্রতিস্থাপন করে এবং অক্ষর অক্ষর প্রতিস্থাপন করে)। এই মাস্কিং পদ্ধতিটি একটি নির্দিষ্ট পরিমাণে সংবেদনশীল তথ্যের বিন্যাস নিশ্চিত করবে এবং পরবর্তী ডেটা প্রয়োগকে সহজতর করবে। কিছু অর্থপূর্ণ শব্দের জন্য, যেমন মানুষ এবং স্থানের নাম, মাস্কিং অভিধানের প্রয়োজন হতে পারে।
ডেটা প্রতিস্থাপন: ডেটা প্রতিস্থাপন নাল এবং র্যান্ডম মান মাস্কিংয়ের অনুরূপ, তবে বিশেষ অক্ষর বা র্যান্ডম মান ব্যবহার করার পরিবর্তে, মাস্কিং ডেটা একটি নির্দিষ্ট মান দিয়ে প্রতিস্থাপিত হয়।
প্রতিসম এনক্রিপশন: সিমেট্রিক এনক্রিপশন একটি বিশেষ রিভার্সিবল মাস্কিং পদ্ধতি। এটি এনক্রিপশন কী এবং অ্যালগরিদমের মাধ্যমে সংবেদনশীল ডেটা এনক্রিপ্ট করে। সাইফারটেক্সট ফর্ম্যাটটি লজিক্যাল নিয়মে মূল ডেটার সাথে সামঞ্জস্যপূর্ণ।
গড়: পরিসংখ্যানগত পরিস্থিতিতে প্রায়শই গড় স্কিম ব্যবহার করা হয়। সংখ্যাসূচক তথ্যের জন্য, আমরা প্রথমে তাদের গড় গণনা করি, এবং তারপর এলোমেলোভাবে গড়ের চারপাশে সংবেদনশীল মানগুলি বিতরণ করি, এইভাবে তথ্যের যোগফল স্থির রাখি।
অফসেট এবং রাউন্ডিং: এই পদ্ধতিটি ডিজিটাল ডেটাকে এলোমেলোভাবে পরিবর্তন করে। অফসেট রাউন্ডিং ডেটার নিরাপত্তা বজায় রেখে পরিসরের আনুমানিক সত্যতা নিশ্চিত করে, যা পূর্ববর্তী স্কিমগুলির তুলনায় প্রকৃত ডেটার কাছাকাছি এবং বৃহৎ ডেটা বিশ্লেষণের ক্ষেত্রে এর তাৎপর্য অত্যন্ত গুরুত্বপূর্ণ।
সুপারিশকৃত মডেল "এমএল-এনপিবি-৫৬৬০"ডেটা মাস্কিংয়ের জন্য"
৪. সাধারণত ব্যবহৃত ডেটা মাস্কিং কৌশল
(১). পরিসংখ্যানগত কৌশল
ডেটা নমুনা এবং ডেটা একত্রিতকরণ
- ডেটা স্যাম্পলিং: ডেটা সেটের একটি প্রতিনিধিত্বমূলক উপসেট নির্বাচন করে মূল ডেটা সেটের বিশ্লেষণ এবং মূল্যায়ন শনাক্তকরণ কৌশলগুলির কার্যকারিতা উন্নত করার জন্য একটি গুরুত্বপূর্ণ পদ্ধতি।
- ডেটা একত্রীকরণ: মাইক্রোডেটার বৈশিষ্ট্যগুলিতে প্রয়োগ করা পরিসংখ্যানগত কৌশলগুলির (যেমন যোগফল, গণনা, গড়, সর্বোচ্চ এবং সর্বনিম্ন) সংগ্রহ হিসাবে, ফলাফলটি মূল ডেটা সেটের সমস্ত রেকর্ডের প্রতিনিধিত্ব করে।
(২)। ক্রিপ্টোগ্রাফি
সংবেদনশীলতা হ্রাস বা কার্যকারিতা বৃদ্ধির জন্য ক্রিপ্টোগ্রাফি একটি সাধারণ পদ্ধতি। বিভিন্ন ধরণের এনক্রিপশন অ্যালগরিদম বিভিন্ন সংবেদনশীলতা হ্রাসের প্রভাব অর্জন করতে পারে।
- ডিটারমিনিস্টিক এনক্রিপশন: একটি অ-র্যান্ডম সিমেট্রিক এনক্রিপশন। এটি সাধারণত আইডি ডেটা প্রক্রিয়া করে এবং প্রয়োজনে সিফারটেক্সটকে ডিক্রিপ্ট করে মূল আইডিতে পুনরুদ্ধার করতে পারে, তবে কীটি সঠিকভাবে সুরক্ষিত করা প্রয়োজন।
- অপরিবর্তনীয় এনক্রিপশন: হ্যাশ ফাংশনটি ডেটা প্রক্রিয়াকরণের জন্য ব্যবহৃত হয়, যা সাধারণত আইডি ডেটার জন্য ব্যবহৃত হয়। এটি সরাসরি ডিক্রিপ্ট করা যায় না এবং ম্যাপিং সম্পর্ক সংরক্ষণ করতে হবে। এছাড়াও, হ্যাশ ফাংশনের বৈশিষ্ট্যের কারণে, ডেটা সংঘর্ষ ঘটতে পারে।
- হোমোমরফিক এনক্রিপশন: সাইফারটেক্সট হোমোমরফিক অ্যালগরিদম ব্যবহার করা হয়। এর বৈশিষ্ট্য হল সাইফারটেক্সট অপারেশনের ফলাফল ডিক্রিপশনের পরে প্লেইনটেক্সট অপারেশনের মতোই। অতএব, এটি সাধারণত সংখ্যাসূচক ক্ষেত্রগুলি প্রক্রিয়া করার জন্য ব্যবহৃত হয়, তবে কর্মক্ষমতার কারণে এটি ব্যাপকভাবে ব্যবহৃত হয় না।
(৩)। সিস্টেম প্রযুক্তি
দমন প্রযুক্তি গোপনীয়তা সুরক্ষা পূরণ করে না এমন ডেটা আইটেমগুলি মুছে ফেলে বা রক্ষা করে, কিন্তু সেগুলি প্রকাশ করে না।
- মাস্কিং: এটি অ্যাট্রিবিউটের মান মাস্ক করার জন্য সবচেয়ে সাধারণ ডিসেনসিটিজেশন পদ্ধতিকে বোঝায়, যেমন প্রতিপক্ষের নম্বর, আইডি কার্ডটি তারকাচিহ্ন দিয়ে চিহ্নিত করা, অথবা ঠিকানাটি ছোট করা।
- স্থানীয় দমন: নির্দিষ্ট বৈশিষ্ট্য মান (কলাম) মুছে ফেলার প্রক্রিয়াকে বোঝায়, অপ্রয়োজনীয় ডেটা ক্ষেত্রগুলি সরিয়ে ফেলা;
- রেকর্ড দমন: নির্দিষ্ট রেকর্ড (সারি) মুছে ফেলার প্রক্রিয়াকে বোঝায়, অপ্রয়োজনীয় ডেটা রেকর্ড মুছে ফেলা।
(৪) ছদ্মনাম প্রযুক্তি
ছদ্মনামকরণ হল একটি ডি-আইডেন্টিফিকেশন কৌশল যা সরাসরি শনাক্তকারী (অথবা অন্যান্য সংবেদনশীল শনাক্তকারী) প্রতিস্থাপনের জন্য ছদ্মনাম ব্যবহার করে। ছদ্মনাম কৌশলগুলি প্রতিটি তথ্য বিষয়ের জন্য প্রত্যক্ষ বা সংবেদনশীল শনাক্তকারীর পরিবর্তে অনন্য শনাক্তকারী তৈরি করে।
- এটি মূল আইডির সাথে সামঞ্জস্যপূর্ণভাবে এলোমেলো মান তৈরি করতে পারে, ম্যাপিং টেবিল সংরক্ষণ করতে পারে এবং ম্যাপিং টেবিলে অ্যাক্সেস কঠোরভাবে নিয়ন্ত্রণ করতে পারে।
- আপনি ছদ্মনাম তৈরি করতে এনক্রিপশন ব্যবহার করতে পারেন, তবে ডিক্রিপশন কীটি সঠিকভাবে রাখতে হবে;
এই প্রযুক্তিটি বিপুল সংখ্যক স্বাধীন ডেটা ব্যবহারকারীর ক্ষেত্রে ব্যাপকভাবে ব্যবহৃত হয়, যেমন ওপেন প্ল্যাটফর্মের ক্ষেত্রে ওপেনআইডি, যেখানে বিভিন্ন ডেভেলপার একই ব্যবহারকারীর জন্য বিভিন্ন ওপেনআইডি সংগ্রহ করে।
(৫)। সাধারণীকরণ কৌশল
সাধারণীকরণ কৌশল বলতে এমন একটি ডি-আইডেন্টিফিকেশন কৌশলকে বোঝায় যা একটি ডেটা সেটে নির্বাচিত বৈশিষ্ট্যের গ্রানুলারিটি হ্রাস করে এবং ডেটার আরও সাধারণ এবং বিমূর্ত বর্ণনা প্রদান করে। সাধারণীকরণ প্রযুক্তি বাস্তবায়ন করা সহজ এবং রেকর্ড-স্তরের ডেটার সত্যতা রক্ষা করতে পারে। এটি সাধারণত ডেটা পণ্য বা ডেটা রিপোর্টে ব্যবহৃত হয়।
- রাউন্ডিং: নির্বাচিত বৈশিষ্ট্যের জন্য একটি রাউন্ডিং বেস নির্বাচন করা জড়িত, যেমন ঊর্ধ্বমুখী বা নিম্নমুখী ফরেনসিক, ফলাফল 100, 500, 1K, এবং 10K প্রদান করে।
- উপরে এবং নীচের কোডিং কৌশল: থ্রেশহোল্ডের উপরে (বা নীচে) মানগুলিকে উপরের (বা নীচে) স্তরের প্রতিনিধিত্বকারী একটি থ্রেশহোল্ড দিয়ে প্রতিস্থাপন করুন, যার ফলে "X এর উপরে" বা "X এর নীচে" ফলাফল পাওয়া যাবে।
(৬)। র্যান্ডমাইজেশন কৌশল
এক ধরণের ডি-আইডেন্টিফিকেশন কৌশল হিসেবে, র্যান্ডমাইজেশন প্রযুক্তি বলতে র্যান্ডমাইজেশনের মাধ্যমে একটি অ্যাট্রিবিউটের মান পরিবর্তন করাকে বোঝায়, যাতে র্যান্ডমাইজেশনের পরের মানটি মূল আসল মান থেকে আলাদা হয়। এই প্রক্রিয়াটি আক্রমণকারীর একই ডেটা রেকর্ডের অন্যান্য অ্যাট্রিবিউট মান থেকে একটি অ্যাট্রিবিউট মান অর্জনের ক্ষমতা হ্রাস করে, তবে ফলস্বরূপ ডেটার সত্যতাকে প্রভাবিত করে, যা উৎপাদন পরীক্ষার ডেটার সাথে সাধারণ।
পোস্টের সময়: সেপ্টেম্বর-২৭-২০২২