নেটওয়ার্ক প্যাকেট ব্রোকারে ডেটা মাস্কিং প্রযুক্তি এবং সমাধান কী?

1। ডেটা মাস্কিংয়ের ধারণা

ডেটা মাস্কিং ডেটা মাস্কিং হিসাবেও পরিচিত। আমরা যখন মাস্কিং বিধি এবং নীতিমালা দিয়েছি তখন মোবাইল ফোন নম্বর, ব্যাংক কার্ড নম্বর এবং অন্যান্য তথ্য হিসাবে সংবেদনশীল ডেটা রূপান্তর, সংশোধন বা কভার করার জন্য এটি একটি প্রযুক্তিগত পদ্ধতি। এই কৌশলটি মূলত অবিশ্বাস্য পরিবেশে সরাসরি ব্যবহার করা থেকে সংবেদনশীল ডেটা রোধ করতে ব্যবহৃত হয়।

ডেটা মাস্কিং নীতি: পরবর্তী বিকাশ, পরীক্ষা এবং ডেটা বিশ্লেষণ মাস্কিং দ্বারা প্রভাবিত হবে না তা নিশ্চিত করার জন্য ডেটা মাস্কিংয়ের মূল ডেটা বৈশিষ্ট্য, ব্যবসায়িক নিয়ম এবং ডেটা প্রাসঙ্গিকতা বজায় রাখা উচিত। মাস্কিংয়ের আগে এবং পরে ডেটা ধারাবাহিকতা এবং বৈধতা নিশ্চিত করুন।

2। ডেটা মাস্কিং শ্রেণিবিন্যাস

ডেটা মাস্কিং স্ট্যাটিক ডেটা মাস্কিং (এসডিএম) এবং ডায়নামিক ডেটা মাস্কিং (ডিডিএম) এ বিভক্ত করা যেতে পারে।

স্ট্যাটিক ডেটা মাস্কিং (এসডিএম): স্ট্যাটিক ডেটা মাস্কিংয়ের জন্য উত্পাদন পরিবেশ থেকে বিচ্ছিন্নতার জন্য একটি নতুন অ-উত্পাদন পরিবেশ ডাটাবেস স্থাপনের প্রয়োজন। সংবেদনশীল ডেটা উত্পাদন ডাটাবেস থেকে বের করা হয় এবং তারপরে নন-প্রোডাকশন ডাটাবেসে সংরক্ষণ করা হয়। এইভাবে, ডিসেনসিটাইজড ডেটা উত্পাদন পরিবেশ থেকে বিচ্ছিন্ন করা হয়, যা ব্যবসায়ের চাহিদা পূরণ করে এবং উত্পাদন ডেটার সুরক্ষা নিশ্চিত করে।

এসডিএম

গতিশীল ডেটা মাস্কিং (ডিডিএম): এটি সাধারণত উত্পাদন পরিবেশে বাস্তব সময়ে সংবেদনশীল ডেটা সংবেদনশীল করতে ব্যবহৃত হয়। কখনও কখনও, বিভিন্ন পরিস্থিতিতে একই সংবেদনশীল ডেটা পড়তে বিভিন্ন স্তরের মাস্কিং প্রয়োজন। উদাহরণস্বরূপ, বিভিন্ন ভূমিকা এবং অনুমতিগুলি বিভিন্ন মাস্কিং স্কিমগুলি প্রয়োগ করতে পারে।

ডিডিএম

ডেটা রিপোর্টিং এবং ডেটা পণ্যগুলি মাস্কিং অ্যাপ্লিকেশন

এই জাতীয় পরিস্থিতিতে মূলত অভ্যন্তরীণ ডেটা মনিটরিং পণ্য বা বিলবোর্ড, বাহ্যিক পরিষেবা ডেটা পণ্য এবং ডেটা বিশ্লেষণের উপর ভিত্তি করে প্রতিবেদনগুলি যেমন ব্যবসায়িক প্রতিবেদন এবং প্রকল্প পর্যালোচনা অন্তর্ভুক্ত রয়েছে।

ডেটা রিপোর্টিং পণ্য মাস্কিং

3। ডেটা মাস্কিং সমাধান

সাধারণ ডেটা মাস্কিং স্কিমগুলির মধ্যে রয়েছে: অবৈধকরণ, এলোমেলো মান, ডেটা প্রতিস্থাপন, প্রতিসম এনক্রিপশন, গড় মান, অফসেট এবং রাউন্ডিং ইত্যাদি

অবৈধকরণ: অবৈধকরণ সংবেদনশীল ডেটা এনক্রিপশন, কাটা বা লুকানো বোঝায়। এই স্কিমটি সাধারণত বিশেষ প্রতীকগুলির সাথে বাস্তব ডেটা প্রতিস্থাপন করে (যেমন *)। অপারেশনটি সহজ, তবে ব্যবহারকারীরা মূল ডেটার ফর্ম্যাটটি জানতে পারে না, যা পরবর্তী ডেটা অ্যাপ্লিকেশনগুলিকে প্রভাবিত করতে পারে।

এলোমেলো মান: এলোমেলো মানটি সংবেদনশীল ডেটার এলোমেলো প্রতিস্থাপনকে বোঝায় (সংখ্যাগুলি প্রতিস্থাপনগুলি, অক্ষরগুলি বর্ণগুলি প্রতিস্থাপন করে এবং অক্ষরগুলি অক্ষরগুলি প্রতিস্থাপন করে)। এই মাস্কিং পদ্ধতিটি একটি নির্দিষ্ট পরিমাণে সংবেদনশীল ডেটার ফর্ম্যাটটি নিশ্চিত করবে এবং পরবর্তী ডেটা অ্যাপ্লিকেশনটিকে সহজতর করবে। কিছু অর্থবহ শব্দ যেমন লোক এবং স্থানগুলির নাম হিসাবে মাস্কিং অভিধানের প্রয়োজন হতে পারে।

ডেটা প্রতিস্থাপন: ডেটা প্রতিস্থাপন নাল এবং এলোমেলো মানগুলির মাস্কিংয়ের অনুরূপ, বিশেষ অক্ষর বা এলোমেলো মান ব্যবহার না করে মাস্কিং ডেটা একটি নির্দিষ্ট মানের সাথে প্রতিস্থাপন করা হয়।

প্রতিসম এনক্রিপশন: প্রতিসম এনক্রিপশন একটি বিশেষ বিপরীতমুখী মাস্কিং পদ্ধতি। এটি এনক্রিপশন কী এবং অ্যালগরিদমের মাধ্যমে সংবেদনশীল ডেটা এনক্রিপ্ট করে। সাইফারটেক্সট ফর্ম্যাটটি যৌক্তিক নিয়মের মূল ডেটার সাথে সামঞ্জস্যপূর্ণ।

গড়: গড় স্কিমটি প্রায়শই পরিসংখ্যানগত পরিস্থিতিতে ব্যবহৃত হয়। সংখ্যার ডেটার জন্য, আমরা প্রথমে তাদের গড় গণনা করি এবং তারপরে এলোমেলোভাবে গড়ের চারপাশে ডিসেনসিটাইজড মানগুলি বিতরণ করি, এইভাবে ডেটাটির যোগফলকে ধ্রুবক রেখে।

অফসেট এবং গোলাকার: এই পদ্ধতিটি এলোমেলো শিফট দ্বারা ডিজিটাল ডেটা পরিবর্তন করে। অফসেট রাউন্ডিং ডেটার সুরক্ষা বজায় রাখার সময় পরিসীমাটির আনুমানিক সত্যতা নিশ্চিত করে, যা পূর্ববর্তী স্কিমগুলির তুলনায় আসল ডেটার কাছাকাছি এবং বড় ডেটা বিশ্লেষণের দৃশ্যে দুর্দান্ত তাত্পর্য রয়েছে।

এমএল-এনপিবি -5660- 数据脱敏

সুপারিশ মডেল "এমএল-এনপিবি -5660"ডেটা মাস্কিংয়ের জন্য

4। সাধারণত ব্যবহৃত ডেটা মাস্কিং কৌশল

(1)। পরিসংখ্যান কৌশল

ডেটা স্যাম্পলিং এবং ডেটা সমষ্টি

- ডেটা স্যাম্পলিং: ডেটা সেটের একটি প্রতিনিধি উপসেট নির্বাচন করে মূল ডেটা সেটের বিশ্লেষণ এবং মূল্যায়ন ডি-সনাক্তকরণ কৌশলগুলির কার্যকারিতা উন্নত করার জন্য একটি গুরুত্বপূর্ণ পদ্ধতি।

- ডেটা সমষ্টি: মাইক্রোডাটাতে বৈশিষ্ট্যগুলিতে প্রয়োগ করা পরিসংখ্যানগত কৌশলগুলির সংগ্রহ হিসাবে (যেমন সংক্ষিপ্তকরণ, গণনা, গড়, সর্বাধিক এবং সর্বনিম্ন), ফলাফলটি মূল ডেটা সেটে সমস্ত রেকর্ডের প্রতিনিধি।

(2)। ক্রিপ্টোগ্রাফি

ক্রিপ্টোগ্রাফি হ'ল ডিসেনসিটিাইজেশনের কার্যকারিতা সংবেদনশীল বা বাড়ানোর জন্য একটি সাধারণ পদ্ধতি। বিভিন্ন ধরণের এনক্রিপশন অ্যালগরিদম বিভিন্ন ডিসেনসিটিজেশন প্রভাব অর্জন করতে পারে।

- ডিটারমিনিস্টিক এনক্রিপশন: একটি অ-এলোমেলো প্রতিসম এনক্রিপশন। এটি সাধারণত আইডি ডেটা প্রক্রিয়া করে এবং প্রয়োজনে মূল আইডিতে সাইফারেক্সটটি ডিক্রিপ্ট এবং পুনরুদ্ধার করতে পারে তবে কীটি সঠিকভাবে সুরক্ষিত করা দরকার।

- অপরিবর্তনীয় এনক্রিপশন: হ্যাশ ফাংশনটি ডেটা প্রক্রিয়া করতে ব্যবহৃত হয়, যা সাধারণত আইডি ডেটার জন্য ব্যবহৃত হয়। এটি সরাসরি ডিক্রিপ্ট করা যায় না এবং ম্যাপিং সম্পর্ক অবশ্যই সংরক্ষণ করতে হবে। এছাড়াও, হ্যাশ ফাংশনের বৈশিষ্ট্যের কারণে, ডেটা সংঘর্ষ হতে পারে।

- হোমোমর্ফিক এনক্রিপশন: সাইফারেক্সট হোমোমোরফিক অ্যালগরিদম ব্যবহৃত হয়। এর বৈশিষ্ট্যটি হ'ল সাইফারটেক্সট অপারেশনের ফলাফল ডিক্রিপশনের পরে প্লেটেক্সট অপারেশনের মতো। অতএব, এটি সাধারণত সংখ্যার ক্ষেত্রগুলি প্রক্রিয়া করতে ব্যবহৃত হয় তবে এটি পারফরম্যান্সের কারণে ব্যাপকভাবে ব্যবহৃত হয় না।

(3)। সিস্টেম প্রযুক্তি

দমন প্রযুক্তি এমন ডেটা আইটেমগুলি মুছে দেয় বা ield াল দেয় যা গোপনীয়তা সুরক্ষা পূরণ করে না, তবে সেগুলি প্রকাশ করে না।

- মাস্কিং: এটি প্রতিপক্ষের নম্বর, আইডি কার্ডটিকে একটি নক্ষত্রের সাথে চিহ্নিত করা হয়, বা ঠিকানাটি কেটে ফেলা হয় এমন বৈশিষ্ট্যটির মানটি মুখোশ দেওয়ার জন্য এটি সর্বাধিক সাধারণ ডিসেনসিটিজেশন পদ্ধতিটিকে বোঝায়।

- স্থানীয় দমন: নির্দিষ্ট অ্যাট্রিবিউট মানগুলি (কলাম) মুছে ফেলার প্রক্রিয়াটিকে বোঝায়, অ-অপরিহার্য ডেটা ক্ষেত্রগুলি অপসারণ;

- রেকর্ড দমন: নির্দিষ্ট রেকর্ডগুলি (সারি) মুছে ফেলার প্রক্রিয়াটি বোঝায়, অ-অপরিহার্য ডেটা রেকর্ডগুলি মোছা।

(4)। ছদ্মনাম প্রযুক্তি

সিউডোমেনিং একটি ডি-আইডেন্টিফিকেশন কৌশল যা সরাসরি শনাক্তকারী (বা অন্যান্য সংবেদনশীল শনাক্তকারী) প্রতিস্থাপনের জন্য একটি ছদ্মনাম ব্যবহার করে। ছদ্মনাম কৌশলগুলি প্রত্যক্ষ বা সংবেদনশীল শনাক্তকারীদের পরিবর্তে প্রতিটি পৃথক তথ্য বিষয়ের জন্য অনন্য শনাক্তকারী তৈরি করে।

- এটি মূল আইডির সাথে সামঞ্জস্য করতে, ম্যাপিং টেবিলটি সংরক্ষণ করতে এবং ম্যাপিং টেবিলের অ্যাক্সেসকে কঠোরভাবে নিয়ন্ত্রণ করতে স্বাধীনভাবে এলোমেলো মান তৈরি করতে পারে।

- আপনি ছদ্মনাম উত্পাদন করতে এনক্রিপশনও ব্যবহার করতে পারেন, তবে ডিক্রিপশন কীটি সঠিকভাবে রাখতে হবে;

এই প্রযুক্তিটি বিপুল সংখ্যক স্বতন্ত্র ডেটা ব্যবহারকারীদের ক্ষেত্রে যেমন ওপেনআইডি ওপেনআইডি ওপেনআইডি -তে ওপেনআইডি, যেখানে বিভিন্ন বিকাশকারী একই ব্যবহারকারীর জন্য বিভিন্ন ওপেনআইডি পান।

(5)। সাধারণীকরণ কৌশল

সাধারণীকরণ কৌশলটি একটি ডি-সনাক্তকরণ কৌশলকে বোঝায় যা একটি ডেটা সেটে নির্বাচিত বৈশিষ্ট্যের গ্রানুলারিটি হ্রাস করে এবং ডেটার আরও সাধারণ এবং বিমূর্ত বিবরণ সরবরাহ করে। সাধারণীকরণ প্রযুক্তি বাস্তবায়ন করা সহজ এবং রেকর্ড-স্তরের ডেটার সত্যতা রক্ষা করতে পারে। এটি সাধারণত ডেটা পণ্য বা ডেটা প্রতিবেদনে ব্যবহৃত হয়।

- রাউন্ডিং: নির্বাচিত বৈশিষ্ট্যের জন্য যেমন একটি রাউন্ডিং বেস নির্বাচন করা জড়িত, যেমন ward র্ধ্বমুখী বা নীচের দিকে ফরেনসিক, ফলন ফলাফল 100, 500, 1 কে এবং 10 কে

- শীর্ষ এবং নীচের কোডিং কৌশলগুলি: শীর্ষ (বা নীচে) স্তরের প্রতিনিধিত্বকারী একটি প্রান্তিকের সাথে প্রান্তিকের উপরে (বা নীচে) মানগুলি প্রতিস্থাপন করুন, "উপরে x" বা "x এর নীচে" এর ফলাফল ফলন করে

(6)। র্যান্ডমাইজেশন কৌশল

এক ধরণের ডি-সনাক্তকরণ কৌশল হিসাবে, র্যান্ডমাইজেশন প্রযুক্তি র্যান্ডমাইজেশনের মাধ্যমে কোনও বৈশিষ্ট্যের মান পরিবর্তন করে বোঝায়, যাতে র্যান্ডমাইজেশনের পরে মানটি আসল আসল মান থেকে পৃথক হয়। এই প্রক্রিয়াটি একই ডেটা রেকর্ডে অন্যান্য অ্যাট্রিবিউট মানগুলি থেকে একটি অ্যাট্রিবিউট মান অর্জনের জন্য আক্রমণকারীটির ক্ষমতা হ্রাস করে তবে ফলাফলের ডেটার সত্যতাটিকে প্রভাবিত করে, যা উত্পাদন পরীক্ষার ডেটার সাথে সাধারণ।


পোস্ট সময়: সেপ্টেম্বর -27-2022