PDF转Excel

1.功能说明

将PDF文档转换为Excel文档

代码样例

bool ConvertToXlsx(const wchar_t* pdf_path, const wchar_t* dest_path) {
    PDF2Excel pdf_to_excel;
    auto open_result = pdf_to_excel.Open(pdf_path);
    if (open_result == PDF2Excel::kOpenSuccess) {
        return pdf_to_excel.Save(dest_path);
}
return false;
}

 

方法:PDF2Excel::Open

    • 方法说明:打开PDF文档
    • 调用参数说明:

参数

类型

必须

说明

file_path

const char*或

const wchar_t*

PDF文档路径。

password

const unsigned char*

密码

password_length

size_t

密码长度

返回类型:

类型

说明

    /**

    * @brief 打开结果

    */

    enum OpenResult {

        kOpenFailed,

        kOpenSuccess,

        kOpenNeedPassword = 4,

    };

打开是否成功。

代码样例

PDF2Excel pdf_to_excel;
unsigned char pwd[100] = {  "123456" };
auto open_result = pdf_to_excel.Open(L"F:\\source\\test.pdf", pwd, 6u);
if (open_result != PDF2Excel::kOpenSuccess) {
    switch (open_result) {
        case PDF2Excel::kOpenFailed:
            std::cerr << "打开文档失败." << std::endl;
            break;
        case PDF2Excel::kOpenNeedPassword:
            std::cerr << "文档需要密码." << std::endl;
        default:
            break;
    }
}

 

方法:PDF2Excel::AddPageRange

    • 方法说明:添加转换页面范围,默认转换全部页面
  • 调用参数说明:

参数

类型

必须

说明

start

unsigned int

起始页面

end

unsigned int

结束页面

step

unsigned int

步进,默认值是1

返回类型:

类型

说明

  Void

代码样例

PDF2Excel pdf_to_excel;
auto open_result = pdf_to_excel.Open(L"F:\\source\\test.pdf");
if (open_result == PDF2Excel::kOpenSuccess) {
    pdf_to_excel.AddPageRange(2u,5u);
}

 

方法:PDF2Excel::SetRegion

    • 方法说明:设置转换页面矩形区域
  • 调用参数说明:

参数

类型

必须

说明

left

float

矩形区域左上角x轴坐标值

top

float

矩形区域左上角y轴坐标值

right

float

矩形区域右下角x轴坐标值

bottom

float

矩形区域右下角y轴坐标值

返回类型:

类型

说明

  Void

代码样例

PDF2Excel pdf_to_excel;
auto open_result = pdf_to_excel.Open(L"F:\\source\\test.pdf");
if (open_result == PDF2Excel::kOpenSuccess) {
    pdf_to_excel.SetRegion(100,300,200,200);
}

 

方法:PDF2Excel::GetIgnoreImage

      • 方法说明:获取忽略页面中的图片,默认为否

返回类型:

类型

说明

  Bool

是否忽略页面中的图片

代码样例

PDF2Excel pdf_to_excel;
auto open_result = pdf_to_excel.Open(L"F:\\source\\test.pdf");
if (open_result == PDF2Excel::kOpenSuccess) {
pdf_to_excel.SetIgnoreImage(true);
if (pdf_to_excel.GetIgnoreImage()) {
    std::cout << "忽略图片." << std::endl;
}
}

 

方法:PDF2Excel::GetImageOfEntirePage

      • 方法说明:获取是否将每一页转换为一张图片,默认为否

返回类型:

类型

说明

  bool

是否将每一页转换为一张图片

代码样例

PDF2Excel pdf_to_excel;
auto open_result = pdf_to_excel.Open(L"F:\\source\\test.pdf");
if (open_result == PDF2Excel::kOpenSuccess) {
pdf_to_excel.SetImageOfEntirePage(true);
if (pdf_to_excel.GetImageOfEntirePage()) {
    std::cout << "整个页面转换为图片." << std::endl;
}
}

 

方法:PDF2Excel::GetImageDpi

      • 方法说明:获取文档中图片的DPI

返回类型:

类型

说明

  float

DPI值

代码样例

PDF2Excel pdf_to_excel;
auto open_result = pdf_to_excel.Open(L"F:\\source\\test.pdf");
if (open_result == PDF2Excel::kOpenSuccess) {
    std::cout <<“DPI:”<< pdf_to_excel.GetImageDpi() << std::endl;
}

 

方法:PDF2Excel::SetIgnoreImage

    • 方法说明:设置忽略页面中的图片
  • 调用参数说明:

参数

类型

必须

说明

ignore_image

bool

忽略页面中的图片

返回类型:

类型

说明

  Void

代码样例

PDF2Excel pdf_to_excel;
auto open_result = pdf_to_excel.Open(L"F:\\source\\test.pdf");
if (open_result == PDF2Excel::kOpenSuccess) {
pdf_to_excel.SetIgnoreImage(true);
}

 

方法:PDF2Excel::SetImageOfEntirePage

    • 方法说明:设置是否将每一页转换为一张图片
  • 调用参数说明:

参数

类型

必须

说明

image_of_entire_page

Bool

是否将每一页转换为一张图片

返回类型:

类型

说明

  Void

代码样例

PDF2Excel pdf_to_excel;
auto open_result = pdf_to_excel.Open(L"F:\\source\\test.pdf");
if (open_result == PDF2Excel::kOpenSuccess) {
pdf_to_excel.SetImageOfEntirePage(true);
}

 

方法:PDF2Excel::SetImageDpi

    • 方法说明:设置转换后图片的DPI
  • 调用参数说明:

参数

类型

必须

说明

dpi

float

图片的DPI

返回类型:

类型

说明

  Void

代码样例

PDF2Excel pdf_to_excel;
auto open_result = pdf_to_excel.Open(L"F:\\source\\test.pdf");
if (open_result == PDF2Excel::kOpenSuccess) {
pdf_to_excel.SetImageDpi(90);
}

 

方法:PDF2Excel::GetIgnoreLink

      • 方法说明:获取是否忽略页面中的超链接

返回类型:

类型

说明

  bool

是否忽略页面中的超链接

代码样例

PDF2Excel pdf_to_excel;
auto open_result = pdf_to_excel.Open(L"F:\\source\\test.pdf");
if (open_result == PDF2Excel::kOpenSuccess) {
pdf_to_excel.SetIgnoreLink(true);
if (pdf_to_excel.GetIgnoreLink()) {
    std::cout << "忽略超链接." << std::endl;
}
}

 

方法:PDF2Excel::SetIgnoreLink

    • 方法说明:设置是否忽略页面中的超链接
  • 调用参数说明:

参数

类型

必须

说明

ignore_link

bool

是否忽略页面中的超链接

返回类型:

类型

说明

  Void

代码样例

PDF2Excel pdf_to_excel;
auto open_result = pdf_to_excel.Open(L"F:\\source\\test.pdf");
if (open_result == PDF2Excel::kOpenSuccess) {
pdf_to_excel.SetIgnoreLink(true);
}

 

方法:PDF2Excel::GetExportMode

      • 方法说明:获取导出模式

返回类型:

类型

说明

 

/**

* @brief Excel文档导出模式

*/

enum ExcelExportMode {

    kExportModeEachPageToOneSheet,        /**< @brief 每一页转换到一个单独的工作表(Sheet */

    kExportModeCombineAllPagesToOneSheet, /**< @brief 合并所有页的内容转换到一个工作表(Sheet */

};

Excel文档导出模式

代码样例

PDF2Excel pdf_to_excel;
auto open_result = pdf_to_excel.Open(L"F:\\source\\test.pdf");
if (open_result == PDF2Excel::kOpenSuccess) {
pdf_to_excel.SetExportMode(kExportModeEachPageToOneSheet);
if (pdf_to_excel.GetExportMode()==kExportModeEachPageToOneSheet) {
    std::cout << "每一页转换到一个单独的工作表." << std::endl;
}
}

 

方法:PDF2Excel::SetExportMode

    • 方法说明:设置是否忽略页面中的超链接
  • 调用参数说明:

参数

类型

必须

说明

mode

/**

* @brief Excel文档导出模式

*/

enum ExcelExportMode {

    kExportModeEachPageToOneSheet,        /**< @brief 每一页转换到一个单独的工作表(Sheet */

    kExportModeCombineAllPagesToOneSheet, /**< @brief 合并所有页的内容转换到一个工作表(Sheet */

};

导出模式

返回类型:

类型

说明

  bool

是否设置成功

代码样例

PDF2Excel pdf_to_excel;
auto open_result = pdf_to_excel.Open(L"F:\\source\\test.pdf");
if (open_result == PDF2Excel::kOpenSuccess) {
pdf_to_excel.SetExportMode(kExportModeEachPageToOneSheet);
}

 

方法:PDF2Excel::Save

    • 方法说明:保存转换的文档
  • 调用参数说明:

参数

类型

必须

说明

dest_path

const char*或

const wchar_t*

目标文件路径

office_version

/**

* @brief Office版本

*/

enum OfficeVersion {

    kOffice2003 = 0,

    kOffice2007 = 1

};

Office版本,默认为2007

progress

Progress

保存进度通知对象,默认为空

返回类型:

类型

说明

  Void

代码样例

PDF2Excel pdf_to_excel;
auto open_result = pdf_to_excel.Open(L"F:\\source\\test.pdf");
if (open_result == PDF2Excel::kOpenSuccess) {
pdf_to_excel.SetIgnoreLink(true);
pdf_to_excel.SetExportMode(kExportModeEachPageToOneSheet);
pdf_to_excel.Save(L"F:\\output\\test.xlsx");
}