API Reference

Class

ReaderOptions

Namespace OfficeIMO.Reader

Assembly OfficeIMO.Reader

Source OfficeIMO.Reader/ReaderModels.cs:620

Modifiers sealed

Options controlling extraction behavior for DocumentReader.

Inheritance

Object
ReaderOptions

Constructors

public ReaderOptions() #

OfficeIMO.Reader/ReaderModels.cs:620

Inherited Methods

Properties

public Nullable<Int64> MaxInputBytes { get; set; } #

OfficeIMO.Reader/ReaderModels.cs:614

Optional maximum input size in bytes enforced by DocumentReader when reading from a file or seekable stream. When null, no size limit is enforced.

public Nullable<Int64> OpenXmlMaxCharactersInPart { get; set; } #

OfficeIMO.Reader/ReaderModels.cs:620

OpenXML security: maximum characters allowed per part when opening OpenXML packages (best-effort). When null, the OpenXML SDK default is used.

public Int32 MaxChars { get; set; } #

OfficeIMO.Reader/ReaderModels.cs:625

Maximum characters per emitted chunk (best-effort).

public Int32 MaxTableRows { get; set; } #

OfficeIMO.Reader/ReaderModels.cs:630

Maximum number of table rows included per table chunk (best-effort).

public Boolean IncludeWordFootnotes { get; set; } #

OfficeIMO.Reader/ReaderModels.cs:635

When true, include Word footnotes as a final chunk. Default: true.

public Boolean IncludePowerPointNotes { get; set; } #

OfficeIMO.Reader/ReaderModels.cs:640

When true, include PowerPoint speaker notes when present. Default: true.

public Boolean ExcelHeadersInFirstRow { get; set; } #

OfficeIMO.Reader/ReaderModels.cs:645

Excel: when true, treat the first row as headers. Default: true.

public Int32 ExcelChunkRows { get; set; } #

OfficeIMO.Reader/ReaderModels.cs:650

Excel: number of worksheet rows per emitted chunk. Default: 200.

public String ExcelSheetName { get; set; } #

OfficeIMO.Reader/ReaderModels.cs:655

Excel: optional sheet name. When null, all sheets are extracted.

public String ExcelA1Range { get; set; } #

OfficeIMO.Reader/ReaderModels.cs:660

Excel: optional A1 range. When null, the sheet's used range is used.

public Boolean MarkdownChunkByHeadings { get; set; } #

OfficeIMO.Reader/ReaderModels.cs:665

Markdown: when true, chunk by headings where possible. Default: true.

public MarkdownInputNormalizationOptions MarkdownInputNormalization { get; set; } #

OfficeIMO.Reader/ReaderModels.cs:671

Markdown: optional input normalization applied before parser-aware chunking. This is intended for compact AI/chat markdown fixes while preserving default strict behavior when null.

public Boolean ComputeHashes { get; set; } #

OfficeIMO.Reader/ReaderModels.cs:676

When true, computes source/chunk hashes for incremental indexing workflows. Default: true.