कार्यप्रणाली
डेटा कैसे काम करता है — स्रोत, प्रसंस्करण, और सीमाएँ।
इस साइट पर हर संख्या आधिकारिक U.S. सरकारी बल्क फ़ाइलों से ली जाती है। किसी भी तीसरे पक्ष के एग्रीगेटर को न तो स्क्रैप किया जाता है और न प्रॉक्सी किया जाता है। यहाँ बिल्कुल बताया गया है कि डेटा कहाँ से आता है, इसे कैसे संसाधित किया जाता है, और यह कहाँ कम पड़ता है — ताकि आप इसे स्वयं परख सकें।
स्रोत
- DOL OFLC प्रचलित वेतन (FLAG) — प्रति व्यवसाय (SOC) और क्षेत्र के अनुसार स्तर I–IV प्रचलित वेतन।
- DOL OFLC प्रकटीकरण फ़ाइलें — LCA (ETA-9035), PERM (ETA-9089), PWD (ETA-9141), CW-1, H-2A, H-2B: हर फाइलिंग का नियोक्ता, वेतन, स्तर, SOC, और कार्यस्थल।
- USCIS H-1B Employer Data Hub — प्रति नियोक्ता प्रति वित्तीय वर्ष याचिका स्वीकृतियाँ/अस्वीकृतियाँ (अस्वीकृति-दर संकेत)।
- BLS OEWS — वह सर्वेक्षण जिससे प्रचलित-वेतन स्तर निकाले जाते हैं।
- USGS GNIS — कस्बा → काउंटी मानचित्रण ताकि कस्बे की खोज किसी वेतन क्षेत्र तक पहुँचे।
वर्तमान कवरेज और इंजेस्ट तिथियाँ डेटा स्थिति पेज पर हैं।
इसे कैसे संसाधित किया जाता है
- इंजेशन: हर सरकारी फ़ाइल को कॉलम नाम (स्थिति नहीं) के आधार पर पार्स किया जाता है और एक स्थानीय डेटाबेस में लोड किया जाता है; यदि किसी फ़ाइल का लेआउट बदलता है तो रन स्पष्ट रूप से विफल हो जाता है, इसलिए खराब डेटा चुपचाप आयात नहीं होता।
- नियोक्ता पहचान: जब स्रोत IRS FEIN प्रदान करता है (PERM/PWD) तब फाइलिंग को उसके आधार पर किसी नियोक्ता से मिलाया जाता है, अन्यथा सामान्यीकृत कंपनी नाम पर वापस जाते हैं। इससे किसी नियोक्ता की वे फाइलिंग समेकित हो जाती हैं जो थोड़े अलग नाम स्ट्रिंग्स के तहत दिखाई देती हैं।
- डी-डुप्लीकेशन: फाइलिंग को उनके केस नंबर पर डी-डुप किया जाता है, ताकि ओवरलैपिंग तिमाही फ़ाइलें दोहरी गणना न करें।
- आँकड़े: प्रचलित-वेतन जाँच आपके वार्षिकीकृत ऑफ़र की तुलना स्तर I–IV न्यूनतम सीमा से करती है; मनी-ट्रेस वेंडर-परत की कटौतियों का मॉडल बनाता है; कॉन्फिडेंस स्कोर उन कारकों का एक पारदर्शी भारित मिश्रण है जिन्हें यह दिखाता है।
ईमानदार सीमाएँ
- विलंब: सरकारी फ़ाइलें वास्तविकता से एक से तीन महीने (कभी-कभी अधिक) पीछे रहती हैं। कार्य करने से पहले हमेशा लिंक किए गए स्रोत के विरुद्ध सत्यापित करें।
- नाम-आधारित आरोपण: LCA और USCIS फ़ाइलों में कोई FEIN नहीं होता, इसलिए उन्हें कंपनी नाम से मिलाया जाता है — कई कानूनी नामों के तहत फाइलिंग करने वाला एक बड़ा नियोक्ता बिखर सकता है, और एक सामान्यीकृत नाम साझा करने वाली दो अलग कंपनियाँ मिल सकती हैं। हम अनुमान लगाने के बजाय रिकॉर्ड को निष्पक्ष रूप से दिखाने की ओर झुकते हैं।
- आंशिक डेटासेट: कुछ कार्यक्रमों को केवल कुछ अवधियों के लिए इंजेस्ट किया जाता है (उदाहरण के लिए, PERM एक हालिया हिस्सा है); USCIS बल्क डेटा एक वर्ष या उससे अधिक पीछे रहता है। एक “—” का अर्थ है “इंजेस्ट किए गए डेटा में नहीं,” आवश्यक रूप से शून्य नहीं।
- कोई OPT डेटासेट नहीं: कोई सार्वजनिक प्रति-नियोक्ता OPT/STEM-OPT डेटासेट नहीं है; हम कभी इसे गढ़ते नहीं और आगे-दिखने वाले संकेत के रूप में H-1B रिकॉर्ड पर निर्भर रहते हैं।
- वेतन स्तर: वर्तमान DOL कार्यप्रणाली के तहत स्तर ≈ 17/34/50/67वें पर्सेंटाइल हैं; एक लंबित प्रस्ताव इन्हें बढ़ा देगा।
सुधार
यदि कोई आँकड़ा गलत लगे, तो यह लगभग हमेशा स्रोत से पुनरुत्पादित किया जा सकता है — जाँचें flag.dol.gov या USCIS hub, और पेज के साथ [email protected] पर ईमेल करें।