Ansicht
Dokumentation
ABENREGEX_XSD_SYNTAX_SPECIALS - REGEX XSD SYNTAX SPECIALS
General Data in Customer Master Fill RESBD Structure from EBP Component StructureDiese Dokumentation steht unter dem Copyright der SAP AG.
- Sonderzeichen
Die folgenden Tabellen fassen die Sonderzeichen regulärer XSD-Ausdrücke zusammen.
Mustersyntax
Einstellige Fluchtsymbole
Syntax | Beschreibung |
\n | Zeilenvorschub (0x0A) |
\r | carriage return (0x0D) |
\t | tab (0x09) |
\\ | literal \ |
\| | literal \| |
\. | literal . |
\- | literal - |
\^ | literal ^ |
\? | literal ? |
\* | literal * |
\+ | literal + |
\{ | literal { |
\} | literal } |
\( | literal ( |
\) | literal ) |
\[ | literal [ |
\] | literal ] |
Beim Aktivieren der Option RELAXED_ESCAPES während der Konstruktion eines regulären XSD-Ausdrucks mit CL_ABAP_REGEX=>CREATE_XSD stimmt eine Zeichenfolge \x, die nicht oben in der Tabelle erscheint oder eine andere besondere Bedeutung hat, mit einem Literal x überein. Wenn die Option RELAXED_ESCAPES deaktiviert wurde, löst eine solche Zeichenfolge \x eine Ausnahme aus.
Fluchtsymbole
Syntax | Beschreibung |
. | beliebiges Zeichen mit Ausnahme von Zeilenvorschub und Wagenrücklauf (CR) |
\d | eine Ziffer (unter Berücksichtigung der Unicode-Zeicheneigenschaften) |
\D | ein Zeichen, das keine Ziffer ist |
\p{xx} | ein Zeichen mit der Unicode-Zeicheneigenschaft xx (siehe unten) |
\P{xx} | ein Zeichen ohne die Unicode-Zeicheneigenschaft xx (siehe unten) |
\s | ein Leerraum-Zeichen (unter Berücksichtigung der Unicode-Zeicheneigenschaften) |
\S | ein Zeichen, das kein Leerraum-Zeichen ist |
\w | ein „word“-Zeichen (unter Berücksichtigung der Unicode-Zeicheneigenschaften) |
\W | ein "non-word"-Zeichen |
\i | ein Zeichen, das gegebenenfalls das erste Zeichen eines XML-Namens ist |
\I | ein Zeichen, das gegebenenfalls nicht das erste Zeichen eines XML-Namens ist |
\c | ein Zeichen, das gegebenenfalls nach dem ersten Zeichen in einem XML-Namen vorkommt |
\C | ein Zeichen, das gegebenenfalls nicht nach dem ersten Zeichen in einem XML-Namen vorkommt |
Kategorie-Fluchtsymbol
Syntax | Beschreibung |
\p{xx} | ein Zeichen mit der Unicode-Zeicheneigenschaft xx (siehe unten) |
\P{xx} | ein Zeichen ohne die Unicode-Zeicheneigenschaft xx (siehe unten) |
Allgemeine Kategorien für die Eigenschaften \p und \P
Basierend auf den durch den Unicode-Standard definierten allgemeinen Kategorien
Kategorie-Identifikator | Beschreibung |
C | Sonstiges |
Cc | Kontroll-Zeichen |
Cf | Format-Zeichen |
Cn | Nicht zugeordnet |
Co | Privater Gebrauch |
L | Buchstabe |
Ll | Kleinbuchstabe |
Lm | Modifikationszeichen |
Lo | Sonstiger Buchstabe |
Lt | Erster Buchstabe groß |
Lu | Großbuchstabe |
M | Zeichen |
Mc | Zeichen mit eigener Breite |
Me | Einschließendes Zeichen |
Mn | Zeichen ohne eigene Breite |
N | Ziffer |
Nd | Dezimalziffer |
Nl | Buchstabenbasierte Ziffer |
No | Sonstige Ziffer |
P | Interpunktion |
Pc | Verbindung-Interpunktion |
Pd | Strich-Interpunktion |
Pe | Schließende Interpunktion |
Pf | Finale Interpunktion |
Pi | Initiale Interpunktion |
Po | Sonstige Interpunktion |
Ps | Öffnende Interpunktion |
S | Symbol |
Sc | Währungssymbol |
Sk | Modifikationssymbol |
Sm | Mathematisches Symbol |
So | Sonstiges Symbol |
Z | Trenner |
Zl | Zeilentrenner |
Zp | Absatztrenner |
Zs | Leerzeichentrenner |
Blocknamen für die Eigenschaften \p und \P
Basierend auf den durch den Unicode-Standard definierten Blocknamen.
Die folgenden Blocknamen können unabhängig vom aktuellen UNICODE_HANDLING verwendet werden:
Blockbezeichner | Startcode | Endcode |
IsBasicLatin | #x0000 | #x007F |
IsLatin-1Supplement | #x0080 | #x00FF |
IsLatinExtended-A | #x0100 | #x017F |
IsLatinExtended-B | #x0180 | #x024F |
IsIPAExtensions | #x0250 | #x02AF |
IsSpacingModifierLetters | #x02B0 | #x02FF |
IsCombiningDiacriticalMarks | #x0300 | #x036F |
IsGreek | #x0370 | #x03FF |
IsCyrillic | #x0400 | #x04FF |
IsArmenian | #x0530 | #x058F |
IsHebrew | #x0590 | #x05FF |
IsArabic | #x0600 | #x06FF |
IsSyriac | #x0700 | #x074F |
IsThaana | #x0780 | #x07BF |
IsDevanagari | #x0900 | #x097F |
IsBengali | #x0980 | #x09FF |
IsGurmukhi | #x0A00 | #x0A7F |
IsGujarati | #x0A80 | #x0AFF |
IsOriya | #x0B00 | #x0B7F |
IsTamil | #x0B80 | #x0BFF |
IsTelugu | #x0C00 | #x0C7F |
IsKannada | #x0C80 | #x0CFF |
IsMalayalam | #x0D00 | #x0D7F |
IsSinhala | #x0D80 | #x0DFF |
IsThai | #x0E00 | #x0E7F |
IsLao | #x0E80 | #x0EFF |
IsTibetan | #x0F00 | #x0FFF |
IsMyanmar | #x1000 | #x109F |
IsGeorgian | #x10A0 | #x10FF |
IsHangulJamo | #x1100 | #x11FF |
IsEthiopic | #x1200 | #x137F |
IsCherokee | #x13A0 | #x13FF |
IsUnifiedCanadianAboriginalSyllabics | #x1400 | #x167F |
IsOgham | #x1680 | #x169F |
IsRunic | #x16A0 | #x16FF |
IsKhmer | #x1780 | #x17FF |
IsMongolian | #x1800 | #x18AF |
IsLatinExtendedAdditional | #x1E00 | #x1EFF |
IsGreekExtended | #x1F00 | #x1FFF |
IsGeneralPunctuation | #x2000 | #x206F |
IsSuperscriptsandSubscripts | #x2070 | #x209F |
IsCurrencySymbols | #x20A0 | #x20CF |
IsCombiningMarksforSymbols | #x20D0 | #x20FF |
IsLetterlikeSymbols | #x2100 | #x214F |
IsNumberForms | #x2150 | #x218F |
IsArrows | #x2190 | #x21FF |
IsMathematicalOperators | #x2200 | #x22FF |
IsMiscellaneousTechnical | #x2300 | #x23FF |
IsControlPictures | #x2400 | #x243F |
IsOpticalCharacterRecognition | #x2440 | #x245F |
IsEnclosedAlphanumerics | #x2460 | #x24FF |
IsBoxDrawing | #x2500 | #x257F |
IsBlockElements | #x2580 | #x259F |
IsGeometricShapes | #x25A0 | #x25FF |
IsMiscellaneousSymbols | #x2600 | #x26FF |
IsDingbats | #x2700 | #x27BF |
IsBraillePatterns | #x2800 | #x28FF |
IsCJKRadicalsSupplement | #x2E80 | #x2EFF |
IsKangxiRadicals | #x2F00 | #x2FDF |
IsIdeographicDescriptionCharacters | #x2FF0 | #x2FFF |
IsCJKSymbolsandPunctuation | #x3000 | #x303F |
IsHiragana | #x3040 | #x309F |
IsKatakana | #x30A0 | #x30FF |
IsBopomofo | #x3100 | #x312F |
IsHangulCompatibilityJamo | #x3130 | #x318F |
IsKanbun | #x3190 | #x319F |
IsBopomofoExtended | #x31A0 | #x31BF |
IsEnclosedCJKLettersandMonths | #x3200 | #x32FF |
IsCJKCompatibility | #x3300 | #x33FF |
IsCJKUnifiedIdeographsExtensionA | #x3400 | #x4DB5 |
IsCJKUnifiedIdeographs | #x4E00 | #x9FFF |
IsYiSyllables | #xA000 | #xA48F |
IsYiRadicals | #xA490< | #xA4CF |
IsHangulSyllables | #xAC00 | #xD7A3 |
IsPrivateUse | #xE000 | #xF8FF |
IsCJKCompatibilityIdeographs | #xF900 | #xFAFF |
IsAlphabeticPresentationForms | #xFB00 | #xFB4F |
IsArabicPresentationForms-A | #xFB50 | #xFDFF |
IsCombiningHalfMarks | #xFE20 | #xFE2F |
IsCJKCompatibilityForms | #xFE30 | #xFE4F |
IsSmallFormVariants | #xFE50 | #xFE6F |
IsArabicPresentationForms-B | #xFE70 | #xFEFE |
IsSpecials | #xFEFF | #xFEFF |
IsHalfwidthandFullwidthForms | #xFF00 | #xFFEF |
IsSpecials | #xFFF0 | #xFFFD |
Die folgenden Blocknamen können nur verwendet werden, wenn UNICODE_HANDLING auf STRICT oder IGNORE, aber nicht auf RELAXED gesetzt ist, da sie sich nicht mit der Basic Multilingual Plane überschneiden:
Blockbezeichner | Startcode | Endcode |
IsByzantineMusicalSymbols | #x1D000 | #x1D0FF |
IsMusicalSymbols | #x1D100 | #x1D1FF |
IsMathematicalAlphanumericSymbols | #x1D400 | #x1D7FF |
IsCJKUnifiedIdeographsExtensionB | #x20000 | #x2A6D6 |
IsCJKCompatibilityIdeographsSupplement | #x2F800 | #x2FA1F |
IsTags | #xE0000 | #xE007F |
Quantoren
Syntax | Beschreibung |
? | 0 oder 1, gierig |
* | 0 oder mehr, gierig |
+ | 1 oder mehr, gierig |
{n} | genau n |
{n,m} | Mindestens n, nicht mehr als m, gierig |
{n,} | n oder mehr, gierig |
Genügsame Quantoren (bzw. zurückhaltende Quantoren ) werden nicht unterstützt.
Gruppierung und Erfassung
Syntax | Beschreibung |
(...) | Erfassende Gruppe |
Technisch gesehen existiert das Konzept der erfassenden Gruppen nicht im XSD-Standard, da es keine reinen Standardmethoden gibt, um auf den Inhalt einer Gruppe zu verweisen. Da die ABAP-Implementierung von regulären XSD-Ausdrücken eine Ersetzungssyntax im PCRE-Stil erlaubt, werden alle Gruppen als Erfassungsgruppen betrachtet.
Alternative
Syntax | Beschreibung |
| | Beginn des alternativen Zweigs |
Zeichenklassen
Syntax | Beschreibung |
[...] | Positive Zeichenklasse |
[^...] | Negative Zeichenklasse |
[x-y] | Intervall |
[a-[b]] | Zeichenklassensubtraktion (kann geschachtelt werden) |
Ersetzungssyntax
Während der XSD-Standard nur die Abgleichsoperation für regulärer Ausdrücke definiert, erlaubt die ABAP-Implementierung auch alle anderen Operationen, wie durch CL_ABAP_REGEX und CL_ABAP_MATCHER definiert.
Die Syntax der Ersetzungsmuster für reguläre XSD-Ausrücke ist dieselbe wie bei regulären PCRE-Ausdrücken.
CPI1466 during Backup General Data in Customer Master
Diese Dokumentation steht unter dem Copyright der SAP AG.
Length: 50908 Date: 20240523 Time: 092743 sap01-206 ( 340 ms )