Regulärer Ausdruck für „Alles in Zukunft löschen, aber nur bis zum Beginn von [Ausdruck]“

Regulärer Ausdruck für „Alles in Zukunft löschen, aber nur bis zum Beginn von [Ausdruck]“

Ich bin in Notepad++. Ich habe die folgenden Daten in eine große HTML-Datei eingebettet. Ich möchte die Variablen vor und </ix:nonNumeric>am Ende der Zeilen in eigene Zeilen setzen, sodass die Ausgabe folgendermaßen aussieht:

00891906 1.12.13 30.11.14 30.11.14 Company Accounts Private Limited Company

usw.

Es gibt noch mehr Daten, aber wenn ich Regex dazu bekomme, das zu tun, werde ich den Rest erledigen können. Danke. Sobald es funktioniert, werde ich die Batch-Ersetzung in einem Verzeichnis verwenden und dies mit einer Reihe von txt-Dateien machen.

Wenn jemand das obige Problem lösen und den dafür vorgesehenen Regex-Eintrag für Suchen und Ersetzen von Notepad++ anzeigen kann, sollte ich es knacken können. Das macht mich wahnsinnig.

Die vollständigen Daten und die Ausdrücke, die ich geschrieben habe, um die Variablen daraus zu extrahieren, finden Sie in dieser TXT-Datei:http://www.filedropper.com/jaderaw

Unten ist der Hauptteil der Daten. Wenn jemand das Folgende für eine Suchen-und-Ersetzen-Funktion in Notepad++ lösen und es mir zeigen könnte, wäre das großartig.

Danke

            `<ix:hidden>
                <ix:nonNumeric contextRef="FY_30_11_2014" name="ns7:NameAuthor" order="1" tupleRef="XBRLDocumentAuthorGrouping_Group45" xmlns:ix="http://www.xbrl.org/2008/inlineXBRL"></ix:nonNumeric>
                <ix:nonNumeric contextRef="FY_30_11_2014" name="ns7:DescriptionOrTitleAuthor" order="2" tupleRef="XBRLDocumentAuthorGrouping_Group45" xmlns:ix="http://www.xbrl.org/2008/inlineXBRL"></ix:nonNumeric>
                <ix:nonNumeric contextRef="FY_30_11_2014" name="ns7:UKCompaniesHouseRegisteredNumber" xmlns:ix="http://www.xbrl.org/2008/inlineXBRL">00891906</ix:nonNumeric>
                <ix:nonNumeric contextRef="CountriesHypercube_FY_30_11_2014_Set1" name="ns7:CountryFormationOrIncorporation" format="ixt2:nocontent" xmlns:ix="http://www.xbrl.org/2008/inlineXBRL" />
                <ix:nonNumeric contextRef="CurrenciesHypercube_FY_30_11_2014_Set2" name="ns7:PrincipalCurrencyUsedInBusinessReport" format="ixt2:nocontent" xmlns:ix="http://www.xbrl.org/2008/inlineXBRL" />
                <ix:nonNumeric contextRef="EntityOfficersHypercube_FY_30_11_2014_Set3" name="ns5:NameDirectorSigningAccounts" format="ixt2:nocontent" xmlns:ix="http://www.xbrl.org/2008/inlineXBRL" />
                <ix:nonNumeric contextRef="cfwd_30_11_2014" name="ns7:StartDateForPeriodCoveredByReport" format="ixt2:datedaymonthyear" xmlns:ix="http://www.xbrl.org/2008/inlineXBRL">1.12.13</ix:nonNumeric>
                <ix:nonNumeric contextRef="cfwd_30_11_2014" name="ns7:EndDateForPeriodCoveredByReport" format="ixt2:datedaymonthyear" xmlns:ix="http://www.xbrl.org/2008/inlineXBRL">30.11.14</ix:nonNumeric>
                <ix:nonNumeric contextRef="cfwd_30_11_2014" name="ns7:BalanceSheetDate" format="ixt2:datedaymonthyear" xmlns:ix="http://www.xbrl.org/2008/inlineXBRL">30.11.14</ix:nonNumeric>
                <ix:nonNumeric contextRef="FY_30_11_2014" name="ns7:EntityAccountsType" xmlns:ix="http://www.xbrl.org/2008/inlineXBRL">Company accounts</ix:nonNumeric>
                <ix:nonNumeric contextRef="FY_30_11_2014" name="ns7:LegalFormOfEntity" xmlns:ix="http://www.xbrl.org/2008/inlineXBRL">Private Limited Company</ix:nonNumeric>
                <ix:nonNumeric contextRef="FY_30_11_2014" name="ns7:DescriptionPeriodCoveredByReport" xmlns:ix="http://www.xbrl.org/2008/inlineXBRL">FY</ix:nonNumeric>
                <ix:nonNumeric contextRef="FY_30_11_2014" name="ns7:EntityTrading" format="ixt2:booleantrue" xmlns:ix="http://www.xbrl.org/2008/inlineXBRL">true</ix:nonNumeric>
                <ix:nonNumeric contextRef="FY_30_11_2014" name="ns7:EntityDormant" format="ixt2:booleanfalse" xmlns:ix="http://www.xbrl.org/2008/inlineXBRL">false</ix:nonNumeric>
                <ix:nonNumeric contextRef="FY_30_11_2014" name="ns5:AccountsPreparedUnderHistoricalCostConventionInAccordanceWithFRSSE" format="ixt2:booleantrue" xmlns:ix="http://www.xbrl.org/2008/inlineXBRL">true</ix:nonNumeric>
                <ix:nonNumeric contextRef="FY_30_11_2014" name="ns5:CompanyExemptFromPreparingCashFlowStatementUnderFRS1" format="ixt2:booleanfalse" xmlns:ix="http://www.xbrl.org/2008/inlineXBRL">false</ix:nonNumeric>
                <ix:nonNumeric contextRef="FY_30_11_2014" name="ns5:AccountsHaveBeenPreparedInAccordanceWithProvisionsSmallCompaniesRegime" format="ixt2:booleantrue" xmlns:ix="http://www.xbrl.org/2008/inlineXBRL">true</ix:nonNumeric>
                <ix:nonNumeric contextRef="FY_30_11_2014" name="ns5:RelatedPartyTransactionExemptionBeingClaimed" format="ixt2:booleanfalse" xmlns:ix="http://www.xbrl.org/2008/inlineXBRL">false</ix:nonNumeric>
                <ix:nonNumeric contextRef="FY_30_11_2014" name="ns6:CompanyHasActedAsAnAgentDuringPeriod" format="ixt2:booleanfalse" xmlns:ix="http://www.xbrl.org/2008/inlineXBRL">false</ix:nonNumeric>
                <ix:nonNumeric contextRef="SharesHypercube_FY_30_11_2014_Set4" name="ns7:DescriptionShareType" xmlns:ix="http://www.xbrl.org/2008/inlineXBRL">Ordinary</ix:nonNumeric>
                <ix:nonFraction contextRef="SharesHypercube_FY_30_11_2014_Set4" name="ns5:ParValueShare" unitRef="GBP" decimals="INF" format="ixt2:numdotdecimal" scale="0" xmlns:ix="http://www.xbrl.org/2008/inlineXBRL">1.00000</ix:nonFraction>
            <ix:tuple name="ns7:XBRLDocumentAuthorGrouping" tupleID="XBRLDocumentAuthorGrouping_Group45" /></ix:hidden>
            <ix:references>
            <link:schemaRef xlink:href="http://www.xbrl.org/uk/gaap/core/2009-09-01/uk-gaap-full-2009-09-01.xsd" xlink:type="simple" /></ix:references>
            <ix:resources>
            <xbrli:unit id="GBP"><xbrli:measure>iso4217:GBP</xbrli:measure></xbrli:unit><xbrli:unit id="USD"><xbrli:measure>iso4217:USD</xbrli:measure>`

Antwort1

Um zunächst eine Reihe unabhängiger regulärer Ausdrücke zu kombinieren, verwenden Sie einfach dieWechselcharakter( | ) Zeichen dazwischen, was „dieser Ausdruck ODER dann Ausdruck“ bedeutet. Beispiel:

expr1 = "^[a-z]+"
expr2 = "^[0-9]+"
combinedexpr = "^[a-z]+ | ^[0-9]+" 

Der kombinierte Ausdruck würde mit jeder Zeichenfolge übereinstimmen, die mit einem Kleinbuchstaben ODER einer Zahl beginnt.

Was NPP betrifft, wird die Suchmethode für reguläre Ausdrücke normalerweise mit der Ersetzungsoption verwendet. Sie möchten Ihre regulären Ausdrücke also im Wesentlichen umkehren, sodass sie alle Zeichenfolgen zurückgeben, die NICHT die gewünschten Ausdrücke sind. Anschließend ersetzen Sie sie durch nichts und lassen nur die Zeichenfolgen übrig, die Sie interessieren.

Wenn Sie dies wirklich mit mehreren Dateien tun müssen, sollten Sie ein Skript in Python oder Powershell oder einem anderen Programm erstellen, damit Sie die Ein- und Ausgaben steuern können oder um die umständliche Umkehrung Ihrer regulären Ausdrücke zu umgehen, einfach weil die Suche von NPP mit Suchen/Ersetzen zusammenhängt. Möglicherweise finden Sie auch ein NPP-Plugin, mit dem Sie bestimmte Übereinstimmungen extrahieren können, aber dies ist keine Standardfunktion.

In diesem Artikel erfahren Sie, wie Sie mithilfe eines Powershell-Skripts in Windows Regex-Übereinstimmungen aus einer angegebenen Datei extrahieren:http://www.gfi.com/blog/windows-powershell-extracting-strings-using-regular-expressions/

Viel Glück

verwandte Informationen