নেটওয়ার্ক প্যাকেট ব্রোকারে ডেটা মাস্কিং প্রযুক্তি ও সমাধান কী?

১. ডেটা মাস্কিং-এর ধারণা

ডেটা মাস্কিং ডেটা মাস্কিং নামেও পরিচিত। এটি একটি প্রযুক্তিগত পদ্ধতি, যার মাধ্যমে মাস্কিং নিয়ম ও নীতিমালা নির্ধারণ করে মোবাইল ফোন নম্বর, ব্যাঙ্ক কার্ড নম্বর এবং অন্যান্য তথ্যের মতো সংবেদনশীল ডেটাকে রূপান্তর, পরিবর্তন বা আড়াল করা হয়। এই কৌশলটি মূলত অনির্ভরযোগ্য পরিবেশে সংবেদনশীল ডেটার সরাসরি ব্যবহার রোধ করতে ব্যবহৃত হয়।

ডেটা মাস্কিং নীতি: ডেটা মাস্কিং-এর মাধ্যমে মূল ডেটার বৈশিষ্ট্য, ব্যবসায়িক নিয়ম এবং প্রাসঙ্গিকতা বজায় রাখা উচিত, যাতে পরবর্তী উন্নয়ন, পরীক্ষা এবং ডেটা বিশ্লেষণ মাস্কিং দ্বারা প্রভাবিত না হয়। মাস্কিং-এর আগে ও পরে ডেটার সামঞ্জস্য এবং বৈধতা নিশ্চিত করুন।

২. ডেটা মাস্কিং শ্রেণিবিন্যাস

ডেটা মাস্কিংকে স্ট্যাটিক ডেটা মাস্কিং (SDM) এবং ডাইনামিক ডেটা মাস্কিং (DDM) - এই দুই ভাগে ভাগ করা যায়।

স্ট্যাটিক ডেটা মাস্কিং (এসডিএম)স্ট্যাটিক ডেটা মাস্কিংয়ের জন্য প্রোডাকশন এনভায়রনমেন্ট থেকে বিচ্ছিন্ন রাখতে একটি নতুন নন-প্রোডাকশন এনভায়রনমেন্ট ডেটাবেস স্থাপন করা প্রয়োজন। সংবেদনশীল ডেটা প্রোডাকশন ডেটাবেস থেকে বের করে এনে নন-প্রোডাকশন ডেটাবেসে সংরক্ষণ করা হয়। এইভাবে, অসংবেদনশীল ডেটা প্রোডাকশন এনভায়রনমেন্ট থেকে বিচ্ছিন্ন থাকে, যা ব্যবসায়িক চাহিদা পূরণ করে এবং প্রোডাকশন ডেটার নিরাপত্তা নিশ্চিত করে।

এসডিএম

ডাইনামিক ডেটা মাস্কিং (ডিডিএম)এটি সাধারণত প্রোডাকশন এনভায়রনমেন্টে রিয়েল টাইমে সংবেদনশীল ডেটার সংবেদনশীলতা কমানোর জন্য ব্যবহৃত হয়। কখনও কখনও, বিভিন্ন পরিস্থিতিতে একই সংবেদনশীল ডেটা পড়ার জন্য বিভিন্ন স্তরের মাস্কিং প্রয়োজন হয়। উদাহরণস্বরূপ, বিভিন্ন রোল এবং পারমিশন ভিন্ন ভিন্ন মাস্কিং স্কিম প্রয়োগ করতে পারে।

ডিডিএম

ডেটা রিপোর্টিং এবং ডেটা পণ্য মাস্কিং অ্যাপ্লিকেশন

এই ধরনের দৃশ্যকল্পের মধ্যে প্রধানত অন্তর্ভুক্ত রয়েছে অভ্যন্তরীণ ডেটা পর্যবেক্ষণ পণ্য বা বিলবোর্ড, বাহ্যিক পরিষেবা ডেটা পণ্য এবং ডেটা বিশ্লেষণের উপর ভিত্তি করে তৈরি প্রতিবেদন, যেমন ব্যবসায়িক প্রতিবেদন এবং প্রকল্প পর্যালোচনা।

ডেটা রিপোর্টিং পণ্য মাস্কিং

৩. ডেটা মাস্কিং সলিউশন

প্রচলিত ডেটা মাস্কিং স্কিমগুলোর মধ্যে রয়েছে: ইনভ্যালিডেশন, র‍্যান্ডম ভ্যালু, ডেটা রিপ্লেসমেন্ট, সিমেট্রিক এনক্রিপশন, অ্যাভারেজ ভ্যালু, অফসেট ও রাউন্ডিং ইত্যাদি।

অবৈধকরণঅবৈধকরণ বলতে সংবেদনশীল ডেটার এনক্রিপশন, সংক্ষিপ্তকরণ বা গোপন করাকে বোঝায়। এই পদ্ধতিতে সাধারণত আসল ডেটাকে বিশেষ চিহ্ন (যেমন *) দিয়ে প্রতিস্থাপন করা হয়। প্রক্রিয়াটি সহজ, কিন্তু ব্যবহারকারীরা আসল ডেটার ফরম্যাট জানতে পারেন না, যা পরবর্তী ডেটা অ্যাপ্লিকেশনগুলিকে প্রভাবিত করতে পারে।

এলোমেলো মানর‍্যান্ডম ভ্যালু বলতে সংবেদনশীল ডেটার এলোমেলো প্রতিস্থাপনকে বোঝায় (সংখ্যা দ্বারা অঙ্ক, অক্ষর দ্বারা অক্ষর এবং বিশেষ্য দ্বারা বিশেষ্য প্রতিস্থাপিত হয়)। এই মাস্কিং পদ্ধতিটি সংবেদনশীল ডেটার ফরম্যাটকে একটি নির্দিষ্ট সীমা পর্যন্ত নিশ্চিত করবে এবং পরবর্তী ডেটা অ্যাপ্লিকেশনকে সহজতর করবে। কিছু অর্থবহ শব্দের জন্য, যেমন ব্যক্তি ও স্থানের নামের ক্ষেত্রে, মাস্কিং ডিকশনারির প্রয়োজন হতে পারে।

ডেটা প্রতিস্থাপনডেটা প্রতিস্থাপন নাল এবং র‍্যান্ডম মান মাস্কিং করার মতোই, তবে এক্ষেত্রে বিশেষ অক্ষর বা র‍্যান্ডম মান ব্যবহার করার পরিবর্তে মাস্কিং ডেটা একটি নির্দিষ্ট মান দ্বারা প্রতিস্থাপিত হয়।

প্রতিসম এনক্রিপশনসিমেট্রিক এনক্রিপশন হলো একটি বিশেষ প্রতিবর্তনযোগ্য মাস্কিং পদ্ধতি। এটি এনক্রিপশন কী এবং অ্যালগরিদমের মাধ্যমে সংবেদনশীল ডেটা এনক্রিপ্ট করে। এর সাইফারটেক্সট ফরম্যাটটি যৌক্তিক নিয়ম অনুসারে মূল ডেটার সাথে সামঞ্জস্যপূর্ণ থাকে।

গড়গড় পদ্ধতিটি প্রায়শই পরিসংখ্যানগত ক্ষেত্রে ব্যবহৃত হয়। সংখ্যাসূচক তথ্যের জন্য, আমরা প্রথমে সেগুলোর গড় নির্ণয় করি এবং তারপরে সংবেদনহীন মানগুলোকে গড়ের চারপাশে এলোমেলোভাবে বিতরণ করি, যার ফলে উপাত্তের যোগফল স্থির থাকে।

অফসেট এবং রাউন্ডিংএই পদ্ধতিটি র‍্যান্ডম শিফটের মাধ্যমে ডিজিটাল ডেটা পরিবর্তন করে। অফসেট রাউন্ডিং ডেটার নিরাপত্তা বজায় রেখে রেঞ্জের আনুমানিক সত্যতা নিশ্চিত করে, যা পূর্ববর্তী স্কিমগুলোর তুলনায় আসল ডেটার বেশি কাছাকাছি এবং বিগ ডেটা বিশ্লেষণের ক্ষেত্রে এর ব্যাপক তাৎপর্য রয়েছে।

ML-NPB-5660-数据脱敏

সুপারিশকৃত মডেল "এমএল-এনপিবি-৫৬৬০ডেটা মাস্কিং এর জন্য

৪. সচরাচর ব্যবহৃত ডেটা মাস্কিং কৌশলসমূহ

(1). পরিসংখ্যানগত কৌশল

ডেটা স্যাম্পলিং এবং ডেটা একত্রীকরণ

ডেটা স্যাম্পলিং: ডি-আইডেন্টিফিকেশন কৌশলগুলোর কার্যকারিতা উন্নত করার জন্য, মূল ডেটা সেট থেকে একটি প্রতিনিধিত্বমূলক উপসেট নির্বাচন করে তার বিশ্লেষণ ও মূল্যায়ন করা একটি গুরুত্বপূর্ণ পদ্ধতি।

ডেটা অ্যাগ্রিগেশন: মাইক্রোডেটার অ্যাট্রিবিউটগুলোর উপর প্রয়োগ করা পরিসংখ্যানগত কৌশলগুলোর (যেমন যোগফল, গণনা, গড়, সর্বোচ্চ ও সর্বনিম্ন) একটি সংগ্রহ, যার ফলাফল মূল ডেটা সেটের সমস্ত রেকর্ডের প্রতিনিধিত্ব করে।

(2). ক্রিপ্টোগ্রাফি

ক্রিপ্টোগ্রাফি হলো সংবেদনশীলতা হ্রাস করার বা এই হ্রাসের কার্যকারিতা বাড়ানোর একটি প্রচলিত পদ্ধতি। বিভিন্ন ধরনের এনক্রিপশন অ্যালগরিদম বিভিন্ন মাত্রার সংবেদনশীলতা হ্রাসকারী প্রভাব অর্জন করতে পারে।

ডিটারমিনিস্টিক এনক্রিপশন: এটি একটি নন-র‍্যান্ডম সিমেট্রিক এনক্রিপশন। এটি সাধারণত আইডি ডেটা প্রসেস করে এবং প্রয়োজনে সাইফারটেক্সট ডিক্রিপ্ট করে মূল আইডিতে ফিরিয়ে আনতে পারে, কিন্তু এর জন্য কী-টিকে যথাযথভাবে সুরক্ষিত রাখতে হয়।

- অপরিবর্তনীয় এনক্রিপশন: ডেটা প্রক্রিয়াকরণের জন্য হ্যাশ ফাংশন ব্যবহার করা হয়, যা সাধারণত আইডি ডেটার জন্য ব্যবহৃত হয়। এটি সরাসরি ডিক্রিপ্ট করা যায় না এবং ম্যাপিং সম্পর্ক অবশ্যই সংরক্ষণ করতে হয়। এছাড়াও, হ্যাশ ফাংশনের এই বৈশিষ্ট্যের কারণে ডেটা সংঘর্ষ ঘটতে পারে।

হোমোমরফিক এনক্রিপশন: এক্ষেত্রে সাইফারটেক্সট হোমোমরফিক অ্যালগরিদম ব্যবহার করা হয়। এর বৈশিষ্ট্য হলো, ডিক্রিপশনের পর সাইফারটেক্সট অপারেশনের ফলাফল প্লেইনটেক্সট অপারেশনের ফলাফলের সমান হয়। তাই, এটি সাধারণত নিউমেরিক্যাল ফিল্ড প্রসেস করার জন্য ব্যবহৃত হয়, কিন্তু পারফরম্যান্সগত কারণে এর ব্যবহার খুব বেশি প্রচলিত নয়।

(3). সিস্টেম প্রযুক্তি

দমন প্রযুক্তি সেইসব ডেটা আইটেম মুছে ফেলে বা আড়াল করে যেগুলো গোপনীয়তা সুরক্ষার মানদণ্ড পূরণ করে না, কিন্তু সেগুলো প্রকাশ করে না।

মাস্কিং: এটি অ্যাট্রিবিউটের মান গোপন করার সবচেয়ে প্রচলিত সংবেদনশীলতা কমানোর পদ্ধতিকে বোঝায়, যেমন প্রতিপক্ষের নম্বর, আইডি কার্ডে তারকাচিহ্ন (*) দেওয়া, বা ঠিকানা সংক্ষিপ্ত করা।

- স্থানীয় দমন: নির্দিষ্ট অ্যাট্রিবিউটের মান (কলাম) মুছে ফেলা, অর্থাৎ অনাবশ্যক ডেটা ফিল্ড অপসারণ করার প্রক্রিয়াকে বোঝায়;

রেকর্ড দমন: নির্দিষ্ট রেকর্ড (সারি) মুছে ফেলার বা অপ্রয়োজনীয় ডেটা রেকর্ড ডিলিট করার প্রক্রিয়াকে বোঝায়।

(4). ছদ্মনাম প্রযুক্তি

সিউডোম্যানিং হলো পরিচয় গোপন করার একটি কৌশল, যেখানে সরাসরি শনাক্তকারী (বা অন্য কোনো সংবেদনশীল শনাক্তকারী) এর পরিবর্তে একটি ছদ্মনাম ব্যবহার করা হয়। ছদ্মনাম কৌশলগুলো সরাসরি বা সংবেদনশীল শনাক্তকারীর পরিবর্তে প্রতিটি স্বতন্ত্র তথ্য-বিষয়ের জন্য অনন্য শনাক্তকারী তৈরি করে।

এটি মূল আইডির সাথে সঙ্গতি রেখে স্বাধীনভাবে র‍্যান্ডম মান তৈরি করতে পারে, ম্যাপিং টেবিল সংরক্ষণ করতে পারে এবং ম্যাপিং টেবিলে প্রবেশাধিকার কঠোরভাবে নিয়ন্ত্রণ করতে পারে।

আপনি ছদ্মনাম তৈরি করতেও এনক্রিপশন ব্যবহার করতে পারেন, কিন্তু ডিক্রিপশন কী-টি সঠিকভাবে সংরক্ষণ করতে হবে;

এই প্রযুক্তিটি বিপুল সংখ্যক স্বতন্ত্র ডেটা ব্যবহারকারীর ক্ষেত্রে ব্যাপকভাবে ব্যবহৃত হয়, যেমন ওপেন প্ল্যাটফর্ম পরিস্থিতিতে OpenID, যেখানে বিভিন্ন ডেভেলপার একই ব্যবহারকারীর জন্য ভিন্ন ভিন্ন OpenID সংগ্রহ করে।

(5). সাধারণীকরণ কৌশল

সাধারণীকরণ কৌশল বলতে এমন একটি পরিচয়-হ্রাসকারী কৌশলকে বোঝায়, যা একটি ডেটা সেটের নির্বাচিত অ্যাট্রিবিউটগুলোর সূক্ষ্মতা কমিয়ে ডেটার একটি আরও সাধারণ ও বিমূর্ত বিবরণ প্রদান করে। সাধারণীকরণ প্রযুক্তি প্রয়োগ করা সহজ এবং এটি রেকর্ড-স্তরের ডেটার সত্যতা রক্ষা করতে পারে। এটি সাধারণত ডেটা প্রোডাক্ট বা ডেটা রিপোর্টে ব্যবহৃত হয়।

- রাউন্ডিং: এর মাধ্যমে নির্বাচিত অ্যাট্রিবিউটের জন্য একটি রাউন্ডিং বেস নির্বাচন করা হয়, যেমন আপওয়ার্ড বা ডাউনওয়ার্ড ফরেনসিকস, যার ফলে ১০০, ৫০০, ১কে, এবং ১০কে-এর মতো ফলাফল পাওয়া যায়।

- টপ এবং বটম কোডিং কৌশল: থ্রেশহোল্ডের উপরের (বা নীচের) মানগুলিকে শীর্ষ (বা নীচের) স্তর নির্দেশকারী একটি থ্রেশহোল্ড দিয়ে প্রতিস্থাপন করা, যার ফলে "x-এর উপরে" বা "x-এর নীচে" ফলাফল পাওয়া যায়।

(6). র‍্যান্ডমাইজেশন কৌশল

এক ধরনের পরিচয় গোপনকরণ কৌশল হিসেবে, র‍্যান্ডমাইজেশন প্রযুক্তি বলতে কোনো অ্যাট্রিবিউটের মানকে র‍্যান্ডমাইজেশনের মাধ্যমে এমনভাবে পরিবর্তন করাকে বোঝায়, যাতে র‍্যান্ডমাইজেশনের পরের মানটি তার আসল মূল মান থেকে ভিন্ন হয়। এই প্রক্রিয়াটি একই ডেটা রেকর্ডের মধ্যে থাকা অন্যান্য অ্যাট্রিবিউটের মান থেকে কোনো একটি অ্যাট্রিবিউটের মান বের করার ক্ষেত্রে আক্রমণকারীর ক্ষমতা হ্রাস করে, কিন্তু এর ফলে প্রাপ্ত ডেটার সত্যতাকে প্রভাবিত করে, যা প্রোডাকশন টেস্ট ডেটার ক্ষেত্রে সাধারণ।


পোস্ট করার সময়: ২৭-সেপ্টেম্বর-২০২২